メディアの科学

コンピューターが音を読み解く

～深層学習を活かした実環境下音声認識・音響処理～

概要

近年、スマホでの音声検索をはじめ、音声インタフェースが広く利用されるようになってきています。私たちは、音声インタフェースが利用されるシーンをさらに広げるために、多様な音がたくさん存在する環境でも動作する音声認識や会話シーン分析の研究を進めています。本展示では、多くの音が混在しているときでも音声を精度良く認識するための基盤技術として、近年注目されている「深層学習」に基づく音声処理技術の最新成果を紹介します。音声認識からノイズ除去、環境音認識まで、幅広い音声処理において、革新的な技術の進化をご覧いただけます。また、すでに実用化されている深層学習に基づくリアルタイム音声認識技術も紹介します。