メディアの科学

こんなにガヤガヤした場所でも聞き取ります

~遠隔発話音声認識における雑音除去・深層学習技術の最前線~

概要

近年、音声認識技術は飛躍的に向上していますが、展示会場のような騒がしい場所で口元から離れたマイクを使う場合、雑音や残響の影響が大きくなり、音声認識の性能は大幅に劣化するという問題がありました。この展示では、騒がしい環境でも精度のよい音声認識を実現するための基盤技術を紹介します。具体的には、(1)音声をひずませることなく雑音や残響を低減し、音声認識性能を改善する技術や、(2)雑音の影響を受けた音声を精緻にモデル化するディープラーニング音声認識技術など(※)を、デモを交えてご紹介します。 (※)これらの技術で、公共エリア雑音下でのモバイル音声認識の国際技術評価で、世界1位の精度を達成しています。

当日の様子

ポスター


ポスターの画像をクリックすると、PDFファイルが開きます。

展示担当者

荒木 章子
荒木 章子
メディア情報研究部
木下 慶介
木下 慶介
メディア情報研究部
小川 厚徳
小川 厚徳
メディア情報研究部
Marc Delcroix
Marc Delcroix
メディア情報研究部
吉岡 拓也
吉岡 拓也
メディア情報研究部
伊藤 信貴
伊藤 信貴
メディア情報研究部
樋口 卓哉
樋口 卓哉
メディア情報研究部
Dung Tran
Dung Tran
メディア情報研究部
中谷 智広
中谷 智広
メディア情報研究部