どれくらい正しく聞き取れるか分かります

～正解文が不要な音声認識率推定技術～

概要

音声認識システムの性能を示す音声認識率は、認識結果文と正解文を比較して算出します。しかし、事前に人が音声を聞いて正解文を作成する必要があるため、そのコストが非常に高いという問題点がありました。本展示では、正解文を用いずに音声認識率を推定する技術を紹介します。音声認識技術は着実に進展し応用例も増えていますが、話者や環境などの変動への頑健性は十分ではありません。本技術を用いることで、音声認識技術の導入判断やシステムの自己診断と性能改善が低コストで可能になるなど、音声認識技術の応用先の拡大に貢献すると期待できます。