AIによる物体検出を行うためには、
アノテーションツールと呼ばれるソフトウェアを使って、
画像に対してこの範囲に「人」,「車」, etc… がある、
などと教えるデータを(願わくば…)大量に作成します。
つまり、アノテーションツールによる作業効率への影響は少なくありません。
アノテーションツールとしては、
LabelImg というOSSソフトがWebの記事で紹介されることが多かったのですが、
最近はVoTTというOSSソフトの紹介を目にする事が多くなりました。
開発元はmicrosoftで、UIは Visual Studio Code と似ています。
(Electron を使用しています)
microsoft/VoTT:
https://github.com/microsoft/VoTT
ざっと特徴をまとめると以下になります。
・動画対応
・クラウド連携あり
・各種 Deep Learning フレームワークに対応する出力形式あり
・学習済モデル(pre-trained)でアノテーションできる
ところで、アノテーションツールを使っているときに、
「未知のデータをいい感じにアノテーションしくれるアノテーションツールが欲しい…」
と思ってしまうことは結構”あるある”だと思いますが、
さすがにそれは無理でも、学習済モデル(pre-trained)でアノテーションできる/確認できるというのは良いです。
本質的な部分以外の手間は、結構、省けるようになってきましたね。