機械学習での画像分類・画像認識の流れとポイント
(画像=AREE/stock.adobe.com)

AIについて勉強をし始めると、「機械学習」「画像分類」「画像認識」という言葉も頻繁に目にするようになります。機械学習とは、AIにおける要素技術の1つだと言えますが、具体的にどのようなことを行うのでしょうか? 本コラムでは、画像分類を例として、機械学習の流れとポイントについてお伝えします。

目次

  1. 機械学習としての画像分類とは?
  2. AIを活用して画像分類を行う際の機械学習の処理の流れ
  3. 機械学習の一般的な流れ
  4. 画像分類が活用される背景
  5. 画像分類にAIを活用するときの注意点

機械学習としての画像分類とは?

機械学習とは、機械が膨大なデータを分析・学習をして、その中にあるルールやパターンを獲得する技術のことです。機械学習の代表的な手法がディープラーニング(深層学習)です。

機械学習を活用した技術ですでにさまざまなシーンで実用化されている画像分類ですが、ますが、画像から何かしらの特徴をAIが判断し、動物や食べ物、人間などに分類することです。

AI(人工知能)がより人間に近づき、追い越すためには、人間が積む「経験」の代わりに、AIに「大量のデータ」を与えて、大量のデータの中に潜む法則を見つけられるようになることが必要です。

また、機械学習の目的はテストデータに対し、正しい予測を行うことにあります。例えば、類似した大量の画像をそれぞれの属性ごとに分類する際には、訓練データを使いAIに学習させた後、どれだけテストデータに対して正しくそれぞれの画像を分類できるかにより精度の評価を行います。

AIを活用して画像分類を行う際の機械学習の処理の流れ

ではAIを活用して画像分類を行う際の機械学習の処理の流れについて見てみましょう。

例えば、『画像を「猫」「犬」「牛」のいずれかに分類する』というミッションがあるとします。人間は画像を見て、これは猫だ、これは犬だ、と判断します。この判断を機械学習させるとしたら、どのような流れになるでしょうか?

大きな流れとしては、

  1. それぞれの画像から「猫」「犬」「牛」を区別する「特徴」を抽出する
  2. 予測器を作成する
  3. 未知の画像を「猫」「犬」「牛」のいずかに分類する

となります。

1.にある区別するための特徴とは、例えば、目の形、しっぽの長さ、体の形、口の形などですが、機械学習においてはそれぞれの特徴を数値に置き換えます。

例えば、
目の形:長径と短径の比を計算する
尻尾の長さ:mを単位とした数値にする
体の色:色はRGB値で表現できる
口の形:形状パターンを10個用意し、一番近いパターンの番号で数値化する とすると、6個の数字の並びができます。

これを6次元ベクトルと呼びます。また、画像を特徴づける量なので特徴量と呼ばれます。

ここではわかりやすいように目の形や尻尾の長さを取り上げましたが、実際には数学と画像処理を駆使して特徴量を抽出していきます。ベクトルの長さも6次元ではなく128次元だったり、4096次元だったりします。
つまり、画像は多次元ベクトルで表現されるのです。

特徴量抽出器により、ラベルと紐づいている大量の画像がラベル付きの多次元ベクトルに変換されます。特徴量抽出器は人間が頭をひねって考え出したアルゴリズムで、高度な数学が使われています。

画像から求めた多次元ベクトルは、多次元空間内の点であるため、全てのベクトルを多次元空間内へ配置していきます。

次に、識別器により、この空間内に境界面を作成し、学習により識別器の各種パラメータを決めれば学習終了です。

テスト画像の予測手順は以下のようになります。

機械学習の一般的な流れ

ここまでは機械学習の一例として画像分類を示しましたが、機械学習(教師あり)の一般的な手順を示すと、以下のようになります。

  1. 大量のラベル付きデータを用意する
  2. 特徴量抽出器でデータ1つを1つの特徴量に変換する
  3. 学習により識別器を作る
  4. 特徴量抽出器と識別器を使い予測を行なう

画像分類が活用される背景

AIと機械学習を使った画像分類は、多くの分野で注目されています。画像認識技術は、画像から物体を高精度に特定し、ディープラーニングの進化によって精度はますます高まり、実用化されています。これまで人の目や経験によって判断していた作業が、高精度かつスピーディに平準化することができるため、業務効率化や生産性向上が見込めます。

例えば、Googleが提供している「Googleレンズ」は画像をアップロードすることで、それがどんなものかを説明してくれます。空港などでは人物の画像認識がすでに導入されており、また数多くの商品を扱う店舗では、画像を認識することでどんな商品で価格はいくらなのか、を瞬時に判別できます。

在庫管理とピッキング作業

AIによる画像分類を在庫管理に導入すると、商品の画像を効率的に認識し、数や種類を正確に把握することができ、過剰在庫や在庫不足を防ぐことに繋がります。

また、商品の特徴やカテゴリを自動的に分類してくれるので商品の管理が容易になり、検索や整理がスムーズに行えます。さらに、商品の状態を監視し、劣化や破損を早期に検出することもできるため、品質管理の向上に加えて、顧客満足度の向上にもつながります

このように画像分類を在庫管理に活用することは、正確性、効率性、品質管理、コスト削減の面で多くのメリットをもたらし、企業の競争力向上に貢献するでしょう。

この情報をロボットアームに提供すると、商品を確実にピックアップできます。手作業に比べて作業速度が向上し、ヒューマンエラーが減少します。さらにWMSの自動化が進み、省力化した運営が可能になります。

検品・外観検査や品質検査

工場で生産ラインに画像分類・画像認識の技術を導入することで、検品検査の業務の効率化が期待できます。大量に仕入れられた部品などの入荷検品、汚れや破損がないかの外観検査、出荷時に不良品がないか、出荷数に過不足がないかまで、人の目に頼っていた作業を効率化できます。またどうしても起きがちなヒューマンエラーも機械学習では防ぐことも可能です。

またワインやマグロなどの食品にもこの技術は導入されています。ワインやマグロの目利きは経験を詰んだ職人のみが為せる技術でした。後継者不足なども叫ばれるなか、膨大なデータを学習したAIは、現在ではその精度も高まり、職人とも遜色のない結果を出せるようになりました。

このような活用方法は、今後製造業や建設業の技術承継にも活用されていくでしょう。

無料eBook

  • 製造業DXの教科書
    図版と事例でわかる|製造業DXの教科書

    世界市場での競争の激化や労働人口の減少などが進む今、日本の製造業においてDX(デジタル・トランスフォーメーション)の推進は不可欠です。 このeBookでは、製造業のDXの全体像について詳しく解説します。 DXに必要な技術を製造プロセスごとに紹介するほか、具体的な活用事例、製造業DXの今後の展望まで幅広く理解できる内容になっています。


画像分類にAIを活用するときの注意点

AIを画像分類に活用する際の注意点は、明確な目標設定、高品質な画像データ、そして特徴的な画像の収集は、AIシステムの効果的な運用に不可欠です。

まず、どのような作業にAIを使用するのか、期待される精度や速度を具体的に設定します。これにより、プロジェクトの方向性が明確になります。同時に撮影環境を整え、画像品質を安定させることが必要です。良好な照明や背景、カメラ設定を用意し、ノイズやブラーを最小限に抑え、品質の一貫性を確保します。

さらに、特徴を抽出しやすいように撮影することが、画像分類の成功につながります。対象物を適切な角度や距離から撮影し、必要な情報を明確に捉えるようにします。特に小さな部品や複雑な形状を撮影する場合、工夫が求められます。

【こんな記事も読まれています】
【会員限定動画】サプライウェブで実現するマスカスタマイゼーション時代の企業戦略
製造業における購買・調達業務とは?課題の解決方法も紹介
ビジネスや技術のトレンドに反応しながら進化を続けるCRMの事例を紹介