お問い合わせ
「SmartCloud」問い合わせ
資料請求・お問い合わせ
2022.06.29画像認識AI
画像認識AIの活用にあたって重要なのが「教師データ」の準備です。教師データとは、「例題」と「正解」がペアになるよう整理されたデータのことです。AIの学習手法の1つである「教師あり学習(※)」が実装されている場合、如何に良質な教師データを学習させるかが画像認識AI構築の肝となってきます。
今回は、一般的に教師データの良し悪しの基準となる特徴について、ご説明いたします。データの準備工数が増えてしまうとお悩みの方や、これからデータを準備する方は是非ご参考ください。
画像認識AI「Deeptector」には「物体検出型」「領域検出型」「分類型」「レベル判定型」「正例判定型」の判定パターンがありますが、それぞれに共通して学習に適したデータの特徴は以下の3つです。
画像認識AIでは色や形をピクセル単位で読み取るので、検出対象物の特徴が画角に対して少ないと特徴量が読み取れず、教師データとしての活用が難しくなります。検出対象物が小さい場合は、画像を分割することで画角比を調整すると良いです。
撮影背景が統一されている場合でも、明るさやピントの違いは判定精度に影響を与えてしまいますので、極力統一するようにしましょう。一般的に、ピンボケ画像は判定精度を下げる要因となり易いです。
画像は実際の利用シーンに近い状態が望ましいです。例えば、製造ラインにおいてカメラを定点に設置して画像を撮影するならば、その状態の画像を集める必要があります。検出対象物が写る角度、大きさ、色、形などが、学習時と導入後で異なると、判定の精度に影響が出ます。画像を用意する際は人間が撮影するケースも多くなりますが、実際の利用シーンと大きく異なることがないようにしましょう。
「何枚の画像を集めれば、業務に使える精度が出ますか?」というご質問もよくいただきますが、必要な画像枚数は、お客様が求める精度や、検出したい対象、撮影環境・撮影条件などにより大きく異なります。Deeptectorをお買い求めいただく前のPoC(Proof of Concept, AI適用可否を少量画像・短期間で検証してみる有償サービス)の中で確認した精度をもとに、商用利用時に向けて、どのような学習を行っていくべきかご提案させていただきますので、その中で、枚数についても弊社の見解をお伝えできるかと思います。
なお、気をつけなければいけないのは、検出対象物が複数ある場合です。例えば、検出対象物がりんごで品種A、Bを判定するとします。品種Aは1000画像、品種Bが50画像しかないと、判定の精度が偏る可能性が高くなります。1枚の画像で、品種A、Bそれぞれにおいて3つの特徴を満たして写っていれば、品種Aで1画像、品種Bで1画像としてカウントできます。(厳密には判定パターンにより差異有)
ここまで読んだだけで、「画像の準備ができないなら、導入は難しいのかな」と感じる方もいるかもしれません。異物検出のために導入したいけれども、異物検出自体がまれなので画像の用意が難しいというケースもあるでしょう。
そんな時にこそ、NTTコムウェアにお問い合わせください。まずはお客様課題を調査し、解決手段と実現可能性を検討します。お話しを伺っただけでは判断がつきにくい場合には、訪問させて頂くこともあります。実際の利用シーンに近い画像を取得し検証することで、より精度の高い効果測定を実施させて頂くことが可能です。そちらの結果を踏まえて、お客様にとって画像認識AIの導入が真の解決策なのかを検討させて頂きます。お問い合わせを頂いたからといって、即導入をおすすめすることはありませんのでご安心ください。
また、画像認識AIは導入して終了ではありません。導入後にお客様の業務で成果を出す、つまり判定の精度を上げ、高い精度を維持することが大切です。ですので、NTTコムウェアでは導入前も導入後もしっかりとサポートをいたします。ぜひ、お問い合わせください。
※入力データとそれに対する正解を組み合わせたデータセットを、コンピュータに読み込ませる仕組み。代表的な手法として「回帰(Regression)」と「分類(Classification)」がある。