メディアの科学

研究展示 20

あなたの声に即座にあわせて音声認識

~音声認識精度を高めるニューラルネットの高速適応技術~

概要

近年、音声認識の精度が著しく向上し、様々な場面で利用されるようになっています。しかしそれに伴い、話者によってはシステムが認識しにくい場合があることが問題となっています。この展示では、音声認識システムを話者の声の性質に応じて最適化する「モデル適応技術」に関する研究を紹介します。従来、話者適応には長時間の観測と多くの計算量が必要でした。本研究の成果により、数秒のみの音声データを用いて即座にモデルを話者に適応させ、様々な声に対して更に認識率を向上させることができるようになりました。

ポスター


ポスターの画像をクリックすると、PDFファイルが開きます。

展示担当者

Marc Delcroix
Marc Delcroix
メディア情報研究部
樋口 卓哉
樋口 卓哉
メディア情報研究部
木下 慶介
木下 慶介
メディア情報研究部
小川 厚徳
小川 厚徳
メディア情報研究部
苅田 成樹
苅田 成樹
メディア情報研究部
中谷 智広
中谷 智広
メディア情報研究部