メディアの科学~情報を意のままに扱う~

どれくらい正しく聞き取れるか分かります

~正解文が不要な音声認識率推定技術~

概要

音声認識システムの性能を示す音声認識率は、認識結果文と正解文を比較して算出します。しかし、事前に人が音声を聞いて正解文を作成する必要があるため、そのコストが非常に高いという問題点がありました。本展示では、正解文を用いずに音声認識率を推定する技術を紹介します。音声認識技術は着実に進展し応用例も増えていますが、話者や環境などの変動への頑健性は十分ではありません。本技術を用いることで、音声認識技術の導入判断やシステムの自己診断と性能改善が低コストで可能になるなど、音声認識技術の応用先の拡大に貢献すると期待できます。

当日の様子

ポスター


ポスターの画像をクリックすると、PDFファイルが開きます。

会場図

展示担当者

小川 厚徳
小川 厚徳
メディア情報研究部
Espi Miquel
Espi Miquel
メディア情報研究部
Marc Delcroix
Marc Delcroix
メディア情報研究部
藤本 雅清
藤本 雅清
メディア情報研究部
堀 貴明
堀 貴明
メディア情報研究部