創屋ぷれす

Googleがカクテルパーティー効果をAIで再現

大勢の人が話している中でも自分の興味のある話や単語のみを聞くことができる人間の能力には,カクテルパーティー効果という名前が付いています.
このカクテルパーティー効果をGoogleがAI(ディープラーニング)で実現したそうです.
詳しくはこちら

学習にはYouTubeの動画を使っているそうです.
なぜ動画かというと,音声だけではさすがに難しいようなので,動画による話者の特定も同時に行うことで精度を上げている(もしくは可能にしている)という背景があります.

確かに音声データから大勢の人が話している内のある特定の話だけ抽出したい場面ってありますよね.
さすがはGoogleといった感じです.(動画ありきですが)
そのうち音声データのみから分離が可能な技術が開発されるのではないでしょうか.

Comments are closed.