英語の発音をネイティブのように綺麗に変換

～声道モデルと深層生成モデルを用いた統計的音声変換～

概要

人と人（あるいは人と機械）のコミュニケーションの円滑化を目的として聞き取りにくい音声を聞き取りやすい音声に変換する研究に取り組んでいます。特に本展示では非母語話者の音声を母語話者風の発音の音声に自動変換する技術を紹介します。本研究では変換処理の実時間性と変換音声の自然さを両輪として追求しており、音声の生成過程のモデルや深層生成モデルを用いた変換方式を多面的に検討しています。

当日の様子

ポスター

ポスターの画像をクリックすると、PDFファイルが開きます。

展示担当者

亀岡弘和
メディア情報研究部

金子卓弘
メディア情報研究部

渡邊千紘
メディア情報研究部

青柳滋己
メディア情報研究部

田中宏
メディア情報研究部

平松薫
メディア情報研究部

講演：酒井崇匡 (招待講演) | 前田英作 (所長講演) | 岩田具治 | 金子卓弘 | 柏野牧夫 | 佐藤尚 |
研究展示：1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 |
前へ | 次へ