ホーム / 主な研究成果 / 200万単語のリアルタイム音声認識を実現する高速アルゴリズムとベイズ的音声認識法の開発

200万単語のリアルタイム音声認識を実現する高速アルゴリズムとベイズ的音声認識法の開発 (2004)

« 主な研究成果の一覧にもどる

音声認識には、限られた学習データによる適切なモデルの選択やパラメータの推定方法、膨大な語彙の中から入力音声に最も近い単語列を効率的に探索するアルゴリズムなど、様々な研究課題があります。当研究所では、ベイズ的音声認識VBECを考案し、音声認識という大規模なタスクに対し、学習理論における変分ベイズ法を世界で初めて適用することで、適切なモデル選択、事前知識の利用、および頑健な識別を可能にしました。また、世界的にも例がない200万語という超大語彙を扱う音声認識を可能にする、重み付き有限状態トランスデューサ(WFST)の高速on-the-fly合成法という新しい探索アルゴリズムを開発しました。