Mtcnn
画像の中から、顔を検出するための深層学習モデルです。
顔領域を四角いフレームで囲います。
3つの畳み込みネットワークを使用して画像内の顔を検出します。
Python3.4以上で実装可能です。
3つの畳み込みネットワークとは・・・
- P-net:顔を検出する
- R-net:顔の位置を改善する
- O-net:顔器官点(目とか鼻とか口)を検出する
上記のような別々のネットワークを使用しています。
わが社創屋でも、使ったことあるというエンジニアいわく、
「顔が30度以上傾くとか、逆さまだと、うまく検出できない」と。