創屋ぷれす

mtcnnとは

Mtcnn


画像の中から、顔を検出するための深層学習モデルです。
顔領域を四角いフレームで囲います。

3つの畳み込みネットワークを使用して画像内の顔を検出します。
Python3.4以上で実装可能です。

3つの畳み込みネットワークとは・・・

  • P-net:顔を検出する
  • R-net:顔の位置を改善する
  • O-net:顔器官点(目とか鼻とか口)を検出する

上記のような別々のネットワークを使用しています。

わが社創屋でも、使ったことあるというエンジニアいわく、
「顔が30度以上傾くとか、逆さまだと、うまく検出できない」と。

Comments are closed.