メディアの科学

研究展示 17

英語の発音をネイティブのように綺麗に変換

~声道モデルと深層生成モデルを用いた統計的音声変換~

概要

人と人(あるいは人と機械)のコミュニケーションの円滑化を目的として聞き取りにくい音声を聞き取りやすい音声に変換する研究に取り組んでいます。特に本展示では非母語話者の音声を母語話者風の発音の音声に自動変換する技術を紹介します。本研究では変換処理の実時間性と変換音声の自然さを両輪として追求しており、音声の生成過程のモデルや深層生成モデルを用いた変換方式を多面的に検討しています。

ポスター


ポスターの画像をクリックすると、PDFファイルが開きます。

展示担当者

亀岡 弘和
亀岡 弘和
メディア情報研究部
金子 卓弘
金子 卓弘
メディア情報研究部
渡邊 千紘
渡邊 千紘
メディア情報研究部
青柳 滋己
青柳 滋己
メディア情報研究部
田中 宏
田中 宏
メディア情報研究部
平松 薫
平松 薫
メディア情報研究部