Vol.8 AI側の視点から考える、データの集め方

Vol.8 AI側の視点から考える、データの集め方

現在、複数回に渡り弊社の各エンジニアが順々に技術情報について発信しています。
本日は、島口嵩史が担当です。

今回は、数式を使わずに「AI側の視点から考える、データの集め方」の話をしていきたいと思います。

AI(ディープラーニングは)、自動でデータの差異から特徴を抽出する機能を持っています。
しかし、人が捉えてほしい特徴ばかりを抽出する訳ではありません。
AIの学習を成功させるコツは、AIの視点に立つことです。それにより、適切な学習データを与えることができるようになるのです。 

AIの視点とは、AIにどのようなデータ(数値、画像)を入力すれば、差異に着目しやすく、より期待する特徴を抽出できるのか、を考えてみることです。
例えば、外観検査において不良の種類は多いが、それぞれの不良のサンプル数が少ない場合、各不良の特徴を学習できない場合があります。
日本の製造現場では、よくある話です。歩留まりが99.9%といった製造現場は少なくないと思います。
与えるデータ次第で、AIの能力を十分発揮させることができるか否かが決まるのです。

例として、画像を用いたAIで、錆びている部品を不良として判定する時、学習データに、錆で色が変わっているものと油が付着しているものが混ざっていると、錆だけを見つけることが出来なくなります。
このようにAIは自動で良品、不良品の差異を特徴として捉え、判別する傾向があるのです。

AIが抽出する特徴は、学習途中で人が意図的に操作することが難しく、集めたデータによって決まります。
それがAIのコントロールのしにくさでもあり、同時に強さでもあります。

差異の種類を想定し、その中で期待する「不良の特徴」を抽出させることが大事です。
その特徴抽出が正確であればあるほど、人間が意図する正解に近づいていくのです。
我々は、プログラムをするだけでなく、AI利用の第一歩である、データ収集上における羅針盤という存在でもあるのです。島口でした。

次号も、技術に関する情報をお届けしますので、ぜひご覧ください。