研究講演

ご所望の声でコミュニケーション

～深層生成モデルが切り拓く音声変換の可能性～

メディア情報研究部
田中宏

概要

人と人とのコミュニケーションには、物理的・能力的・心理的な状態に起因する様々な形の制約が存在します。私たちは、ある音声を異なる音声や望みの音声へと変換する技術の研究を通じてこのような制約を取り除き、あらゆる人が不自由なく快適にコミュニケーションを行える環境を実現することをめざしています。本講演では、「“音声”が、近年著しく発展を続けている深層学習と組み合わせると、どんなことができるのか？」を題材に、従来技術の課題と私たちの取組みを紹介します。

講演動画

動画の公開は終了いたしました。ご了承くださいますようお願いいたします。

講演資料

講演者紹介

メディア情報研究部
田中宏

NTT コミュニケーション科学基礎研究所メディア情報研究部研究員。2017年奈良先端科学技術大学院大学情報科学研究科博士課程修了。博士（工学）。同年NTTに入社以来、音声合成・音声変換の研究に従事。深層生成モデルを用いた音声信号処理に特に興味を持つ。奈良先端科学技術大学院大学優秀学生賞や日本音響学会第47回粟屋潔学術奨励賞を受賞。日本音響学会の会員。

講演動画：山田武士 (所長講演)| 大隅典子 (招待講演) | 田中宏 | 黒木忍 | 藤田早苗

研究展示：1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 |
前へ | 次へ

研究講演

概要

講演動画

関連コンテンツ

講演資料

講演者紹介