所長講演

>5月31日(木) 13:20 - 13:50

新たな次元へとシフトする

~さらに深化するコミュニケーション科学の取り組み~
コミュニケーション科学基礎研究所 所長 山田 武士

概要

  コミュニケーション科学基礎研究所(CS研)は、1991年、米国独立記念日と同じ日の7月4日に、NTTの情報系の基礎研究を担う研究所として、けいはんな学研都市内に設立されました。NTTの他の研究所がみな関東に集中する中、小さな研究所がひとつ関西に飛び出し、いわば独立した瞬間でした。設立当初から一貫して既存の研究領域にとらわれず、コミュニケーションを科学するとはどういうことか?にこだわり、情報科学から人間科学、社会科学、人文科学をも巻き込んだ学際的な取り組みを進めてきました。特に音声音響処理、メディア処理、自然言語処理、機械学習に代表されるいわゆるAI(人工知能)技術を中心とした情報科学と人間の脳内における感覚運動処理や幼児の言語獲得の仕組みを解明する人間科学の両方に取り組むことで研究テーマ間の相乗効果を高めています。

  深層学習に代表される、最近のAI技術の発展には目覚ましいものがあります。研究所としては、これらの最先端の技術を高度に使いこなし、直面する課題にうまく適用することも重要ですし、求められてもいます。しかし情報系の基礎研究を担うCS研としては、それ以上に、これまでの地の利やノウハウを活かし更に技術を深め、いわば足場を固めつつ、これまでの延長ではない、新たな次元を切り拓く取り組みに常に挑戦し、研究テーマを大胆にシフトさせていくことが一層重要だと考えています。

  例えば音声認識の研究では、これまでの接話マイクに向かって一人が話す音声認識から、テーブルを囲んで複数人がマイクから離れて自由に話す状況下での音声認識へとシフトしています。そのためには音声認識そのものの性能向上も必要ですが、それ以上に騒がしい環境でも周囲の雑音を取り除く雑音抑圧技術や、室内での壁や床などへの反射による残響を除去する、残響除去技術等の音声強調技術との組み合わせが重要となります。CS研の音声認識は、これらの組み合わせにより2015年に行われた国際技術評価(CHiME-3)で、参加25機関中で第1位の精度を実現しました[1]。さらには、複数の発話の中から聞きたい人の声を選んで聞き取る技術等にも取り組んでいます。

  機械学習技術に関して、CS研は、大量のデータから専門家でも気づかない特徴的なパターンを自動的に見つけ出す技術を研究開発してきました。現在はさらにこれを時空間に拡張した、時空間多次元集合データ解析技術へとシフトさせています[2]。さらに、単なる未来の予測だけでなく、予測の結果どうすべきか(例えばどう人々の流れを誘導すべきか)の最適な方策をリアルタイムに提案してフィードバックする学習型シミュレーション技術にも力を入れています。また、無数の組み合わせの中から与えられた条件を満たす最適なものを見つけ出す、組合せ最適化問題についても、BDDやZDDと呼ばれる、組み合わせ爆発を回避するためのデータ構造を工夫することでこれまで不可能だった大規模な問題が解けるようになっています。

  ロボットとの対話処理の研究においては、これまでの一台のロボットとの対話から、複数台(2台)のロボットとの対話処理へとシフトしています。一人の人間と対話する場合、ロボットは一台で十分に思えますが、複数台のロボットを用いてうまく役割分担することで、一台の場合より、たとえ音声認識に失敗したり、対話の文脈が破綻したりしたとしても、人間にとって自然な対話をより長く続けることができます。また、単なる雑談ではなく、質問応答と雑談の融合により、対話への興味をユーザから引き出しながらユーザに知識を伝える対話システムの実現にも取り組んでいます[3]。

  また、メディア処理においては、単一のメディアの処理から複数のメディアを組み合わせたり、相補的に扱ったりするクロスモーダル情景分析へとシフトしています。この技術が完成すれば、例えばマイクで収録した音声情報から室内のビジュアルな情景を再現することが可能になります。

  人間科学研究にも変化があります。CS研では「視覚」「聴覚」「運動感覚」といった人間の基本的な感覚に関する「潜在的な脳の働き」の解明に注力しています。これらは今後も引き続き取り組みますが、さらに新たなテーマとして、スポーツ脳科学への取り組みが進んでいます[4]。脳科学の知見とICTを活かし、「勝つための脳をきたえる」研究です。また、最近新たに、人間の心の豊かさや満足に関する概念であるウェルビーイングに関する研究が立ち上がりました。これらは触覚研究などとあわせて、人間の「心と身体」の両面に焦点を当てた新たな取り組みです。

  これら、新たな取り組みにはリスクが伴います。すぐに期待通りの学術的な成果が得られるとは限りません。AI研究の分野ではExploration–Exploitation Dilemmaがしばしば問題となります[5]。これは限られたリソースの中で、うまく行くとわかっている周辺をより詳細に探索するExploitationを行うべきか、目先を変えてより広範囲に探索するExplorationを優先すべきか、選択を迫られる、あるいは、バランスをとる必要がある、というものです。基礎研究を担うCS研としては京阪奈も厚木もその独立精神を胸に刻み、未踏の地を目指して大海原に船出するExplorationに、今後も大胆かつ粘り強く取り組んでいきたいと思います。


【関連文献】

講演アーカイブ

下記より本講演の動画をご覧頂けます.
新たな次元へとシフトする
~さらに深化するコミュニケーション科学の取り組み~
30分26秒
再生する

当日の様子

講演資料


画像をクリックすると、PDFファイルが開きます。

講演者紹介