もはやDX戦略には欠かすことのできない「AI」。
「AI」という存在が当たり前になり、その「AI」を用いたビジネスも急速に変化・進化し、世の中の在り方も変わっているのが現状です。
あなたの会社はその変化への追従、先取りができているでしょうか。
「AI」の定着、その背景にある「ディープラーニング」「機械学習」の技術は素晴らしく、常に進化を続けています。
創屋は、AIの技術進化のスピードに対応し最新の「ディープラーニング」「機械学習」の技術を取り入れるとともに、統計や画像処理といった技術、長年業務に携わってきて得た業務知識を組み合わせたAIシステムの開発・研究を行っています。
Topics
2019年10月3日 OKI|AIエッジパートナーシップに掲載
2018年9月25日 NEDOの「AIエッジコンピューティングプロジェクト」に参画
■受託開発/研究開発
「AI」はあくまで手段であり目的ではありません。
目的は、お客様が抱えている問題の解決や、新たな価値を持つサービスを生み出すことです。
そのための「AI」です。
創屋では、コンサルティングによる課題の洗い出しから、調査、分析、そして実際のシステム開発までワンストップで行います。
真に解決したい課題を見つけ出し、的確にご提案させて頂きます。
時には「AI」ではなく従来からある統計的な技術であったり、画像処理の技術で解決できることもあります。
新規性の高い分野や、お客様のアイディアの実現に向けて、共同研究も行っております。また、幅広く受託開発も請け負います。
ディープラーニング・機械学習で「このライブラリで別の技術を使いたいけど」「このデータで何かできないか」「自社でモデルを作ってみたけど精度が上がらない」など、様々なステータスのご相談もお気軽にどうぞ。
いきなりのAIシステム導入が不安な場合は、PoC(概念実証)を通してAIの有用性をご理解いただける AI導入支援プログラム もご用意しています。
お気軽にお問い合わせ下さい。
■AI技術について
□機械学習 (Machine Learning)とは
データを繰り返し学習し、そのデータの中にあるパターン・経験則を認識します。
そして、新たな未知のデータに対して、機械が自律的に認識したパターン・経験則を当てはめて答えを導き出します。
データの中にあるパターンを認識する機構を一般的に「モデル」と呼びます。モデルにデータを入力しパターンを認識させて賢くするプロセスを「学習」と呼びます。
学習には、モデルに入力するデータ「入力データ」、その「入力データ」に対応する「正解のデータ」が必要となります。例えば、写真に写っている動物が何か、をモデルに判別させたいとき、「入力データ」には動物の画像データを、「正解のデータ」には写真に写っている動物の種類を与えることで学習することができます。
機械学習を行う過程の始めに、「入力データ」から特徴量と呼ばれる数値を抽出する必要があります。特徴量とは、「入力データ」にどのような特徴があるかを数値化したものです。
機械学習では、この特徴量の抽出=特徴量設計を行うことで、効率的に、精度良くモデルを学習することができます。良い特徴量を見つける(設計する)ことができれば、より良いモデル、つまり精度の高いモデルを作成できます。しかし、特徴量設計のプロセスは複雑かつ答えがない作業となります。
そのため、この重要でかつ複雑な特徴量設計の作業は、私たちのようなデータサイエンティストが時間をかけて根気強く行うものとなります。私たち創屋には長年、機械学習に携わってきた経験からより良い特徴量を設計するノウハウがあります。
□ディープラーニング (Deep Learning)とは
従来の機械学習では人間が特徴量設計をしなければいけなかったのに対し、ディープラーニングは自動でデータから特徴を抽出しパターンを学習します。ただし、学習自体は従来の機械学習と同様に、「モデル」に「入力データ」と「正解データ」のセットを与えて学習する、ということは変わりません。
非構造化データ(画像や自然言語といったデータ)を扱うことが得意であるという性質もあります。そのため、画像データなど特徴量設計が難しいが大量に存在するデータに対しても、AIを適用することが可能となっています。
データから自動で特徴を抽出しパターンを学習するという性質上、大量のデータが必要になります。少量のデータからでは特徴を抽出できないのです。
つまり、大量のデータを処理(計算)する必要があります。そこでGPUの出番です。
ディープラーニングの発展にはGPUの発展が一因を担っています。GPUを使用した計算により、一昔前では到底終わらなかったような計算ができています。
新しい未知のデータを学習したモデルに入力し出力を得る行為を「推論」と呼びますが、推論時には大量のデータを処理する必要はないので、GPUは必要がない場合もあります。
大量のデータが必要といっても、歩留まり90%後半が当たり前である業界も多く、そういった業界で製品の検品作業をAI化したい、というのは難しい話です(正解となる不良品のデータが少ないため)。
創屋にはこういったデータが少ない、もしくは正解のデータが存在しない場合(上記の例だと、不良品のデータはないが良品のデータは大量にあるパターン)でもより良いモデルを作るノウハウがあります。例えば、データの中の特徴を際立たせ少量のデータからでも効率よく学習を行ったり、教師無し学習と呼ばれる手法を用いて学習を行う等、多岐に渡ります。もちろん教師有り学習の実績も豊富です。
□学習の種類
機械学習の学習方法にはいくつか種類があります。
そのうち、最も使われているのが教師有り学習と呼ばれるものです。
他にも、教師無し学習や半教師有り学習、強化学習といった学習方法があります。
教師有り学習 | 学習データ(入力)を学習する際に予め正解のデータ(出力)を与えることによって、「このような入力(特徴)だとこの答え」というパターンを学習します。 教師有り学習は過去のデータから将来発生しそうな出来事について予測します。 例) スパム判定、 画像認識、 天気予報 |
教師無し学習 | 教師無し学習は教師有り学習と違い、学習データ(入力)のみで学習を行います。 学習データから抽出した特徴量から本質的な構造を学習します。 例) 商品分類、推薦( レコメンド)、 異常検知 |
半教師あり学習 | 教師有り学習と同様にデータを学習します。教師有り学習と違う点は、正解のデータが存在する場合と与えない場合を混在して扱えるという点です。 教師有り学習より高い精度で学習できると言われています。 |
強化学習 | 強化学習は他の学習方法とは異なるものです。 現在の状態を観測して認識し、得られる報酬が一番高くなるような行動を選択します。 つまり、最良の選択を学習します。 例) ロボット工学、 品質管理、 ゲーミング(将棋、囲碁、チェス) |
□活用例
活用シーンは様々です。データの種類で、そのシチュエーションにあったアルゴリズムを選択・使用する必要があります。
・画像データ
できること | 説明 | 使用想定アルゴリズム |
---|
識別・分類 | 画像に写っているものが「何か」、を認識・分類します。 製品の検品作業といった外観検査や、野菜や果物の選別をしたり、医療での診察支援等に使われています。 | FCN、EfficientNet、ResNet、NF-Nets、ViT |
物体検出 | 画像認識・分類では画像に写っているものが「何か」、ということしかできませんが、 物体検出では「何か」に加えて「どこに」という判別をします。 ドローンと組み合わせた建物の外観検査や、防犯・医療分野など適用範囲が広い技術です。 | YOLO、SSD、DERT |
異常検知 | 画像に写っているものが正常なパターンから外れた状態=異常な状態であるかを検知します。 教師無し学習を用いることで、正常なパターンの画像のみでも実現することができます。 例えば、製品の外観検査において、不良品の画像を集めるのは難しいため、 良品の画像のみから異常検知のモデルを学習します。 | FCN、AutoEncoder、GAN、MetricLearning |
類似 | 画像同士を比較し、見た目が類似している画像を判別したり、クラスタリングします。 顔認証や類似の製品(工業製品や服)を探すことができます。 弊社が提供しているAI類似図面検索(リンク貼る)にもこの技術が使われています。 | AutoEncoder、GAN、MetricLearning |
生成・加工 | 画像や情報を与えることで、新たに画像や情報を生成・加工します。 イラストの生成や画像の翻訳(キャプション)、画像の鮮明化、画像の一部を強調・加工することができ、 適用範囲が広い技術です。 | GAN、U-Net |
・自然言語
できること | 説明 | 使用想定アルゴリズム |
---|
分類 | 文章に対する分類をします。 例えば、ニュースの文章であればどういったカテゴリのニュースなのか、 アンケートのネガポジ判別などの課題に対応することができます。 | BERT、Word2Vec、fastText |
タグ付け・重要語抽出 | 文章の中に含まれている重要語(キーフレーズ)、固有表現を抽出します。 文章に対してタグ付けを行うことでどういった属性の文章なのかを把握することができます。 | BERT |
類似・クラスタリング | 文章・単語同士を比較し、類似している文章・単語を判別したり、クラスタリングします。 弊社が提供しているAI類似文書検索(リンク貼る)にもこの技術が使われています。 | BERT、Word2Vec、fastText |
・センサーデータ等の数値データ
できること | 説明 | 使用想定アルゴリズム |
---|
分類 | センサーデータ等の数値データに対する分類・検出を行います。 例えば、加速度センサのデータからどういった行動を取っているかを判別したり、 振動センサから劣化具合を判別することができます。 | DNN、FCN、SVM、LightGBM |
異常検知 | センサーデータ等の数値データが正常なパターンから外れた状態=異常な状態であるかを判別します。 | AutoEncoder、GAN、MetricLearning、k近傍法 |
予測・最適化 | 数値データから未来のデータを予測・最適化します。 需要予測や機械のパラメータの最適化、自動見積など適用範囲が広い技術です。 | DNN、FCN、線形・非線形・ロジスティクス回帰、LightGBM |
■AI事例紹介
お問い合わせください。課題に合わせてご紹介いたします。
■お問い合わせ
ご不明な点やご質問があれば、お問い合わせ下さい。