研究展示

メディアの科学

顔で声の表情を制御する

クロスモーダル音声表情変換

どんな研究

対話や講演において、心理的な緊張状態や能力的な限界などにより思うような話し方で話せない場合があります。本研究では、入力音声の話し方の雰囲気（表情）を、顔の表情や体の動作などの手段により制御することを目的としたクロスモーダル音声表情変換の問題に初めて取り組みました。

どこが凄い

話し方の表情は声質・抑揚・リズムによって決まります。従来技術の多くは声質のみの変換を扱っていましたが、我々の音声変換技術は、声質とともに抑揚やリズムの変換も可能にします。この技術と顔表情識別技術を組み合わせることで、顔画像を用いて声の表情を変換する技術を実現しました。

めざす未来

人と人とのコミュニケーションには、物理的・能力的・心理的な状態に起因する様々な形の制約が存在します。本研究では、このような制約を取り除き、あらゆる人が不自由なく快適にコミュニケーションを行える環境を実現することをめざしています。

ポスター

アイコンをクリックすると、展示ポスターのPDFが開きます。

展示説明ムービー

動画の公開は終了いたしました。ご了承くださいますようお願いいたします。

連絡先

亀岡弘和（Hirokazu Kameoka） メディア情報研究部メディア認識研究グループ
Email: cs-openhouse-ml at hco.ntt.co.jp

講演：山田武士 (所長講演)| 大隅典子 (招待講演) | 田中宏 | 黒木忍 | 藤田早苗

研究展示：1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 |
前へ | 次へ

研究展示

メディアの科学

関連文献

ポスター

展示説明ムービー

関連コンテンツ

連絡先