創屋ぷれす

TensorFlow Object Detection API

TensorFlow


テンソルフローと読みます。
Google Brain というGoogleの開発チームが2015年に公開した、
機械学習の分野で使うソフトウェアライブラリです。(オープンソース)

Tensor(テンソル)とは、多次元のデータ配列のことです。
このTensorを流れるように処理して、ニューラルネットワークを作ったり、訓練したりします。

用途


  • 顔認証
  • 音声認識
  • リアルタイム翻訳
  • 画像の物体認識

↓ YOLOv2 という、物体検出アルゴリズム(手法)がありますが、
そのアルゴリズムを使う際は、このTensorFlowをインストールします。 
YOLOv2とは

TensorFlow Object Detection API


Object Detection : 物体検出
画像より、物体の種類と位置を検出します。
画像の中の物体を四角いフレームで囲います。

弊社創屋で今、開発している案件では、
このTensorFlow Object Detection API を使って、
PDFなどの画像から、テキストやグラフ、表などを識別しようとしています。

電子書籍なんか、たくさんページがあるものを読まずして
要約をすぐに出してくれたなら、なんと便利なことでしょう。

Comments are closed.