メディアの科学

コンピューターが音を読み解く

~深層学習を活かした実環境下音声認識・音響処理~

概要

近年、スマホでの音声検索をはじめ、音声インタフェースが広く利用されるようになってきています。私たちは、音声インタフェースが利用されるシーンをさらに広げるために、多様な音がたくさん存在する環境でも動作する音声認識や会話シーン分析の研究を進めています。本展示では、多くの音が混在しているときでも音声を精度良く認識するための基盤技術として、近年注目されている「深層学習」に基づく音声処理技術の最新成果を紹介します。音声認識からノイズ除去、環境音認識まで、幅広い音声処理において、革新的な技術の進化をご覧いただけます。また、すでに実用化されている深層学習に基づくリアルタイム音声認識技術も紹介します。

当日の様子

ポスター


ポスターの画像をクリックすると、PDFファイルが開きます。

展示担当者

荒木 章子
荒木 章子
メディア情報研究部
藤本 雅清
藤本 雅清
メディア情報研究部
Marc Delcroix
Marc Delcroix
メディア情報研究部
吉岡 拓也
吉岡 拓也
メディア情報研究部
Espi Miquel
Espi Miquel
メディア情報研究部
小川 厚徳
小川 厚徳
メディア情報研究部
木下 慶介
木下 慶介
メディア情報研究部
伊藤 信貴
伊藤 信貴
メディア情報研究部
中谷 智広
中谷 智広
メディア情報研究部
浅見 太一
浅見 太一
メディアインテリジェンス研究所
芦原 孝典
芦原 孝典
メディアインテリジェンス研究所