メディアの科学

声の抑揚が別人に変わる

~基本周波数パターン生成過程モデルに基づく韻律変換~

概要

音声は抑揚に相当する基本周波数(F0)パターンやリズムのつけ方によって異なる印象の話し方になります。本展示では、ある話者と別の話者のF0パターン・リズムを混ぜることにより本人の声色は変えずに話し方だけを変える音声変換技術を紹介します。F0パターンは声帯に張力を与える甲状軟骨の運動によって生み出されていますが、本技術では二つのF0パターンの単純な伸縮や混合ではなく、甲状軟骨に加わる力を合成して音声を生成するため、変換音声の自然性が常に保たれる点がポイントです。映画の俳優の話し方を自分好みに変えたり、非母語話者の音声の抑揚を母語話者風に付け替えたりできる音声処理技術や語学の学習支援として利用できます。

当日の様子

ポスター


ポスターの画像をクリックすると、PDFファイルが開きます。

展示担当者

亀岡 弘和
亀岡 弘和
メディア情報研究部
金子 卓弘
金子 卓弘
メディア情報研究部
柏野 邦夫
柏野 邦夫
メディア情報研究部
林 亜紀
林 亜紀
サービスエボリューション研究所