機械学習系の週ですね。
今日はDeepMindについて。
DeepMindはGoogleが買収したイギリスの人工知能の会社です。(現在はGoogle DeepMindという会社名)
有名なのは、この会社が開発したAlphaGoという人工知能が、2015年に囲碁のヨーロッパチャンピオンを破ったというエピソード。
当時は囲碁のレベルの複雑なゲームには機械学習は及ばないと考えられていたためにインパクトが大きいニュースとして発表されました。
IBMのワトソンは「人の支援をする」というのが開発目的なのに対し、
DeepMindは「知性の謎を解くこと」を目標にしているそうです。
具体的な例として、
ワトソンは、あらかじめ定義された目的のため(食事、ファッションコーディネートなど)に最適化されて開発されていますが、
DeepMindは「自身のシステムが事前にプログラムされていない」にもかかわらず、
インベーダーゲームやブロック崩しなどのレトロゲームを、コード変更すること無しにプレーさせると、
何も手を加えずとも学習していき、人間よりも効率的にプレーするようになるそうです。
「経験からのみ学んでいる」といえます。
これを実現したのが、DeepMindが開発した DQN(deep Q-network) という人工知能。
DeepLearningと強化学習を組み合わせて作られています。
・・・・・・・・
これらの人工知能の現在の欠点は、
人工知能のふるまいの理由を人間が説明できないこと。
AlphaGoの例ですと、人間と対局して負けた際に明らかな悪手を繰り返して負けたそうですが、
その手を指した理由が開発者にもわからなかったそうです。
このような欠点があるために、自動運転にはまだ使えない?という議論や、
暴走し始めたらストップさせるボタンがないとまずいのではないか?という議論があります。
当のDeepMind社も、その欠点は承知しており、Googleに買収される際に、人工知能の倫理委員会を作ること、を条件にしていたそうです。