研究概要Learning and Intelligent Systems Research Group

研究概要

実社会の様々な複雑現象を、統計的学習理論、データマイニング、データストリーム解析、センサーネットワークなどを駆使して解析するための基礎研究を行っています。
具体的な研究内容のいくつかを下記に列挙します。

教師あり学習に基づく時系列の因果推論

時々刻々と変化する時系列データを対象に、その間の原因と結果の関係(因果関係)を自動的に発見する研究です。因果関係を正しく推定するには、各データの性質に即して数式表現(自己回帰モデル)を選ぶ必要があり、データ分析の専門家でなければ困難でした。そこで多様な性質を持つデータを用いて機械学習モデルを学習することで、データ分析の専門知識なしに因果関係を推定できる技術を構築しました。
NTT CS研オープンハウス2019 研究展示 5

グラフ索引型探索技術による絵本検索システム「ぴたりえ」

「間違い混じりのあらすじを入力して絵本を探す」「好みの絵本と似た画風の作家による絵本を探す」など、いろいろな観点で絵本を検索できるシステムの研究開発です。提案手法は、検索対象となる大量のデータを事前に整理して、似たもの同士が接続されたグラフ(ネットワーク)を構成しておくことで高速な検索を実現します。従来手法と異なり、メディア(文章、画像、音声など)の特性に依存しないため、幅広いメディアから抽出する特徴に対応して高速化を実現します。
NTT CS研オープンハウス2019 研究展示 7

シャノン限界を達成する誤り訂正符号」

「高速な通信環境を実現するためには、雑音のある環境下で効率よく正しい情報を送受信する必要があります。これを実現する技術は「誤り訂正符号」と呼ばれており、符号化効率には上限(シャノン限界)があります。 本研究では、一般の通信路でシャノン限界を達成し、かつ実行可能な通信路符号(誤り訂正符号)を実現する符号化方式を確立しました。本方式を用いることで、既存の方法よりも効率のよい通信を実現できます。

NTT CS研オープンハウス2019 研究展示 8

グラフ索引に基づく類似音声探索

膨大なデータの中から即座に類似のデータを見つけるための研究です。例えば、多数の話者がいろいろな発話をしている膨大な音声データの中から、ある特定の話者の発話した音声データや、その話者に類似の声色の別の話者を探すことができます。
NTT CS研オープンハウス2018 研究展示 1

人流データ同化と学習型誘導

多くの人が集まるスポーツイベント等で人の流れをスムーズにすることを目指して、実世界の観測値を反映した人流シミュレーションを実現し、膨大な候補の中から効率的に最適誘導策を探索する技術の研究に取り組んでいます。
NTT CS研オープンハウス2018 研究展示 3

環境センシングと異種データ融合分析によるイベント解析

都市で発生したイベントを収集し、分析する研究に取り組み、藤沢市で6年に渡って実証実験を行ってきました。ゴミ収集車などの公共車両に搭載したセンサによる環境センシングと、そのセンサデータからのイベント抽出、抽出したイベントの解析に取り組んでいます。
NTT CS研オープンハウス2018 研究展示 4

ベイズ的最適化に基づく効率的な誘導計画探索

人や車などの集団の流れが引き起こす近未来の混雑・渋滞リスクを予測し、これを回避する集団最適誘導策をリアルタイムで自動的に導出する技術の研究開発に取り組んでいます。
NTT CS研オープンハウス2017 研究展示 3

大域的最適性を保証する低ランク回帰学習技術 (CFM)

複数の特徴量から目的値を予測する回帰問題を汎用的に、かつ高精度に解く研究です。提案法「Convex Factorization Machines(CFM)」は、データを表す特徴から予測に有用な組合せを見付けて高精度なモデルを作ります。提案法は、価格推定、推薦システム、遺伝子解析などの様々な応用例に適用できます。
NTT CS研オープンハウス2016 研究展示 1

無限バイクラスタリングによる特徴的部分行列の抽出

行列の形式で与えられた関係データの中から、周りと大きく違う値をもつ部分(バイクラスタ)だけを自動的に見つける研究です。そのような部分は「もっとも売れる顧客層と商品群」や「特定の治験で効果のあった遺伝子群」などのように、有益な知識となる可能性が高い部分です。
これまでの技術では、バイクラスタの数を事前に指定する必要があります。しかし、不適切な数を指定すると解析に失敗します。そこで、任意数のバイクラスタを表現可能な機械学習モデルを用いて、各データに対して適切なバイクラスタ数を自動的に推定して抽出できます。
NTT CS研オープンハウス2016 研究展示 2

階層情報を用いた潜在変数モデルの自動生成

複雑な構造を持つデータを解析するために、データに合った確率モデルを自動生成する手法を提案しました。データに合った確率モデルを設計・実装するにはデータに関する知識と機械学習に関する知識の双方を必要とするため、一部の専門家が時間を掛けて行っていました。このため、データを大量に蓄積しても、それらを活かすことが困難でした。本技術を利用すれば、データに合った確率モデルを自動的に生成・学習できるため、データの蓄積から解析・知見発見までが自動化されることが期待されます。
NTT CS研オープンハウス2015 研究展示 1

無線センサノード用汎用超小型仮想マシン CILIX

どこでも簡単に環境センシングを可能にするためのセンサノード用仮想マシンCILIXを開発しています。CILIXを使えば、慣れ親しんだ言語で素早くセンサソフトウェアを開発でき、センサノードを設置した後で無線を使って随時ソフトウェアを更新していくといったアジャイルな(迅速かつ柔軟な)環境センシングが実現できます。 その特徴を活かし、都市部から里山まで様々な場所で環境センシングの実証実験を行っています。
NTT CS研オープンハウス2015 研究展示 6

Page top ←