NTTコミュニケーション科学基礎研究所 契約研究員募集テーマ詳細

title_theme.gif

■遠隔自由発話音声認識の研究

大語彙話し言葉音声認識、および遠隔発話音声認識の研究を行なう。複数人の参加する会議・会話等において、周囲の環境や重なり合う音声により収音条件が悪化した状況でも、高速・高精度な音声認識を実現することが目標である。研究テーマとしては、音響モデル・言語モデルの識別学習および話者・環境適応、ロバスト特徴量抽出、大語彙連続音声認識デコーダ等の基礎研究から、近未来アプリケーションのプロトタイプ構築まで、多岐にわたる。数理的なアルゴリズム開発に長けていて、高いプログラミングスキルを持つ方で、自らテーマを設定し研究を推進する能力と、大規模システムを構築するためのチームプレイを厭わないキャラクタを備える人材を募集する。

■統計的機械学習に基づくデータマイニング

ノンパラメトリックベイズ理論等を駆使した、統計的機械学習に基づくデータマイニング研究分野の優れた人材を募集します。たとえば、購買などの人間行動のモデル化、データに内在する複雑な意味構造のモデル化、ネットワークで表現されるような関係データのモデル化等です。特に、ストリーミングデータに興味がある方も歓迎します。必要なスキルは、ノンパラメトリックベイズ、変分ベイズ、サンプリング、トピックモデル等の、統計的学習の強いバックグラウンド、および、プログラミングスキルです。

■実世界リアルタイムコンテンツ化

センサを使って実世界の情報を取得し、取得した情報を元に実世界で起きたデキゴトを言語や動画で表現するプロジェクトにおいて、

  1. 複数のモノに付けられたセンサデータからのイベント推定
  2. イベントの極小情報による特徴抽出
  3. 実世界情報を利用したWebアプリケーション等の研究開発

に興味のある方を募集します。アプローチとしては、学習ベースやモデルベース、あるいはその折衷のどれでも構いませんが、プログラミングのスキルは必要です。

■統計的機械翻訳の研究

膨大なテキストデータ(対訳データ、単言語データ)から学習される統計モデルを用いて、機械翻訳を実現する技術を研究する。本研究は、翻訳モデル、言語モデル、機械学習アルゴリズム、解探索法、対訳データの自動獲得法などのサブテーマを有する。数理的なアルゴリズム開発に長けており、プログラミングスキルの高い方に是非ご応募いただきたい。本研究では大規模データを扱う必要性があることから、分散並列計算機環境を使いこなすためのアルゴリズム開発も重要なサブテーマとなっている。MPI等を用いた並列プログラミング経験を有しており、数理的アルゴリズムの並列化に長けている方にも是非ご応募いただきたい。

■意味理解に基づく自然言語処理の研究

言語資源とアルゴリズムの双方の精緻化により、書き言葉および話し言葉に対して高度な意味理解に基づく自然言語処理を実現する方法を研究する。具体的には、オントロジー、述語項構造、照応省略、談話構造、発話意図などのモデル化およびこれらの解析技術を応用したアプリケーションの研究開発を行う。自然言語処理に関する深い造詣と卓越したプログラミングスキルを持ち、自らテーマを設定し遂行するための判断力を備える人材を募集する。

■量子情報処理理論の研究

量子情報の枠組みを利用した高度な情報処理に関する研究を行う。量子アルゴリズム、量子情報理論、量子暗号等を研究の対象とし、当該分野における革新的な概念の発見を目指す。量子情報処理全般に関する広い知識と特定の専門領域に関する鋭い洞察力を持ち、テーマの選定と研究遂行を独力でこなせる人材を募集する。

■フォーマルメソッドによるセキュリティプロトコルの解析・設計に関する研究

インターネット上での電子商取引や電子投票に用いられる暗号通信プロトコル(セキュリティプロトコル)の安全性を、数理論理学・計算機科学の手法を駆使して厳密に検証する技術(フォーマルメソッド)について研究します。新しい検証技術の開拓を主な業務とし、さらには、現在利用されている重要なプロトコルの厳密な解析や、今後利用が見込まれる中核的なプロトコルの安全な設計など、波及効果の大きい事例研究にも取り組みます。数理論理学・計算機科学・フォーマルメソッドに関する基本的な知識と、情報セキュリティやプライバシ保護に関する強い関心が必須です。プログラミングの豊富な経験は、自動定理証明ツールなどの検証ツール利用時に有利かもしれません。

■環境知能の研究

人間と環境を仲介し,場に即した適切な働きかけを行うことで,人に知的な愉しみ,発想,安らぎをもたらし,ひいては,人どうしのコミュニケーションを活性化する存在を実現する研究を行っています。この研究において以下のテーマについて人材を募集しています.

  1. 音声と様々な非言語情報(顔向き,視線,ジェスチャー)を統合して,コミュニケーションの状況を理解するマルチモーダル統合環境認識
  2. 複数の人間とエージェントが,音声/非言語情報(顔向き,視線,ジェスチャー等)を使って円滑に会話を進めることを可能とするマルチモーダル会話制御
  3. 複数エージェントの媒介よる自発的思考/親密感の喚起を通した会話活性化戦略の実現
  4. マルチモーダル情報を用いた各モダリティの認識精度の向上
  5. マルチモーダル環境での教師なし学習方法による環境の認識
  6. マルチモーダル情報による感情推定および人間間のコミュニケーション状態の推定
  7. 高齢者、子供に対するマルチモーダル情報の認識
  8. エージェントの表情・行動表出(音声に加えて,視線,顔向き)手法の研究

プログラミングスキルにたけていて、かつ、統計手法や信号処理、画像処理、対話処理、言語処理、心理学などいくつかの分野に深い知識のある方を募集しています。