主な研究成果

研究カテゴリで絞り込む

表示する研究カテゴリのチェックボックスにチェックを付けてください。(複数選択可)
すべて 人間の科学 メディアの科学 コミュニケーションと計算の科学 データと学習の科学

2020

視覚・体性感覚統合による身体表象に基づいた伸張反射応答の形成
急激な姿勢変化を修正するように働く「伸張反射」が、自分の体の動きが見えない状況では小さくなることを発見しました。

人間の科学

BRAVE:誤り耐性低遅延音声符号化の研究開発
マイクとスピーカの間で音声を無線で送る際の入力の整形法を工夫し、短時間で圧縮しつつ誤りに対して頑健な技術を提案しました。

メディアの科学

磁性触覚印刷技術「マグネタクト」
シート上に書き込まれた詳細な磁性パターンにより、さまざまな凹凸触覚刺激を電源を使わず長期間提示する触覚提示技術です。

人間の科学

ICTを利用したスポーツトレーニング
アスリートの無意識な身体動作・反応を可視化・可聴化し、「潜在脳機能」に働きかける直感的なフィードバック手法を提案しています。

人間の科学

地域連携で作るなりきりAI
地域と密接に連携することで、業務に関するQAや受付対応、観光案内などを行うことができる、広報キャラクターを模した“なりきりAI”対話システムです。

コミュニケーションと計算の科学

言葉の難しさを測る─テキストの難易度と人の語彙数の推定
NTTが長年蓄積した言語資源と令和版単語親密度データベースに基づき、テキストの難易度を推定する技術と、数十語をチェックするだけで簡単にその人の語彙数を推定できる技術を提案しました。

コミュニケーションと計算の科学

パーソナル知育絵本
幼児語彙発達に関する研究データに基づき、お子さま一人ひとりの言葉の成長に合わせて絵本の内容が変化する、世界にひとつだけの絵本を作る技術です。

コミュニケーションと計算の科学

部分AUC最大化のための半教師あり学習
機械学習における二値分類問題において、ラベルなしデータを活用することにより、誤検知率を低く抑えた状態で真の異常を見逃さないようにできる技術です。

データと学習の科学

トップアスリートの技を支える脳機能の解明
ICTを駆使した多角的なアプローチで、トップアスリートが様々に高度な技を生み出す脳機能の解明に迫ります。

人間の科学

eスポーツ達人の脳力
脳科学的アプローチによって、eスポーツ選手の実力・コンディション・基礎能力(視覚能力)の特性を客観的に評価しました。

人間の科学

ラグビースクラムのハーモニーを紡ぐ
ラグビーのスクラムで、いかに選手たちが力を結集して相手を押しているか、その協調関係(ハーモニー)をウェアラブルセンサを用いて分析しました。

人間の科学

ストレートは“まっすぐ”か?
野球経験者は、投球の物理的な軌道を正確に捉えているわけではなく、”錯覚”して認識していることを発見しました。

人間の科学

2019

分散型アーキテクチャにおける未知量子状態の新しい活用法の発見とその理論解明
未知の量子状態が増えれば増えるほど、全状態を推定できるようになるという現象の必要十分条件を世界で初めて示しました。

コミュニケーションと計算の科学

高効率・高品質・柔軟な深層音声変換技術の研究
「効率的」「抑揚やリズムといった超分節的特徴などの柔軟な変換」「リアルタイム」「高品質」という4点を可能にした音声変換技術です。

メディアの科学

自然音認識で訓練された人工ニューラルネットワークと聴覚神経系との類似性の発見
音認識用に深層ニューラルネットワークを訓練すると脳での音表現と類似の構造が得られることを発見し、脳は進化の過程で音認識に適した性質を獲得した可能性を示しました。

人間の科学

文脈を理解して話す雑談対話システム
対話中に現れたユーザの体験を5W1H+感想の細分化された文脈情報として理解することで、文脈に沿った応答ができる雑談対話システムです。

コミュニケーションと計算の科学

座っていても歩いているような疑似感覚の生成技術
自宅のリビングに座ったまま、歩行したような感覚を移動範囲の制約を受けずに体験することができる技術です。

人間の科学

時空間データ解析のための時空間回帰テンソル分解法
時空間データに隠された少数かつ重要なパターンとパターン毎に現れる時間・空間相関を同時に学習することで過去データの無い地点の未来を予測する技術です。

データと学習の科学

画像や音を見聞きするだけで賢くなるAI――クロスモーダル情報処理の展開
音から画像や説明文をつくるといった異種メディア間の新たな変換や、メディア情報に含まれる物事についての概念獲得など新しい機能を実現します。

メディアの科学

ゲームで視覚能力をセルフチェック「シカクノモリ」
手持ちのパソコンやタブレット端末を使って視覚機能をセルフチェックし、気軽に自分の視覚について知ることができるテストセットを考案しました。

人間の科学

紙に動きの印象を与える錯覚:Danswing papers
紙人形の輪郭に明暗のエッジを加えつつその紙人形を明るさの変化する背景上に置くだけで、紙人形が動いて見える錯覚を発見しました。

人間の科学

2018

限界まで効率良くメッセージを送れます――シャノン限界を達成する通信路符号
通信路符号だけでなく、情報源符号や暗号などの通信のあらゆる問題の限界達成と実行可能性を両立させる符号を構築しました。

メディアの科学

物知り対話ロボット
雑談を通してユーザに対話への興味を持たせつつ、その興味に応じて知識を伝達する、新感覚の対話AIです。

コミュニケーションと計算の科学

「浮像(うくぞう)」影を駆使して絵に奥行きを与える光投影技術
影を使った錯覚を利用して、印刷された対象や手書き文字が浮いてみえるように錯覚させる技術です。

人間の科学

絵本検索システム「ぴたりえ」
子どもの多種多様な興味や発達の個人差に合わせて絵本を検索できるシステムを開発しました。

コミュニケーションと計算の科学

共通因子を効率的に学習する低ランク回帰技術
従来単一の目的変数の予測に限られていた因子分析を拡張し、複数の目的変数の予測を可能にした技術です。

データと学習の科学

人流データ同化技術
実世界で定点観測した通過人数を基に、経路ごとの人の流量を推定し、正確な人流シミュレーションを可能にする技術です。

データと学習の科学

SpeakerBeam: 聞きたい人の声に耳を傾けるコンピュータ
複数の声が混ざった中から聞きたい声だけを聞き取れる適応型ニューラルネットワーク技術です。ヒトの選択的聴取能力をコンピュータにて世界で初めて実現しました。

メディアの科学

2017

ベイズ的最適化に基づく効率的な誘導計画探索
人や車などの集団の流れが引き起こす近未来の混雑・渋滞リスクを予測し、これを回避する集団最適誘導策をリアルタイムで自動的に導出する技術です。

データと学習の科学

議論構造に基づき論拠提示や反論を行う議論対話システム
特定の話題の深い知識構造と、議論の状態を捕捉し続ける発話理解技術に基づく、人とディスカッションするロボットを構築しました。

コミュニケーションと計算の科学

「ぶるなび4」高い伝達効率で多自由度の牽引力錯覚生成を実現
「ぶるなび3」で実現した装置の小型化技術に加え、さらに力覚伝達効率を上げる技術や多自由度の力覚を生成する技術を提案しました。

人間の科学

選んで創るお気に入りの画像: 深層生成モデルを用いた画像の生成制御
髪型や表情など画像の属性を自在に編集しながら画像生成できる機構により、好みの画像を生成することを可能にする技術です。

メディアの科学

確率的潜在変数モデルによる知識発見
データがどのような仕組みで生成されたのかをモデル化することで、重要で特徴的な性質をビッグデータから自動的に発見し理解することを可能にする技術です。

データと学習の科学

リアルタイム音源伝送向け低遅延・高音質符号化CLEAR
音声や音響信号を、決められたビットレートや処理遅延の中で最大限に音質を保ったまま圧縮し、伝送する符号化方式です。

メディアの科学

2次元表示との互換性を持つステレオ映像生成技術「Hidden Stereo」
3Dメガネをかけない視聴者には2D映像がクリアに見え、メガネをかけた視聴者には自然な3D映像が見えるステレオ映像を生成することができる技術です。

人間の科学

収録環境のブラインド推定に基づく音声の歪みを抑えた雑音抑圧法ASTER
雑音下で収録した音から、音声を歪ませず高精度に雑音を抑圧する技術です。リアルタイムでの動作も可能で、雑音下での音声認識の前処適に適しています。

メディアの科学

開発者利便性が高い単語意味ベクトル学習法の考案
再現性、逐次構築性、省メモリ性といった、実用時にあると非常に役に立つ新たな付加価値を単語埋め込みベクトルに付与する技術です。

コミュニケーションと計算の科学

2016

材質の光学的特性に基づく視覚的質感認知の画像手がかりの解明
湿り具合のような「ものの質感」の状態変化を推定する人間の知覚方略を明らかにし、映像の見かけのウェット感を操作する技術です。

人間の科学

オンライン時空間変数予測技術
逐次的に観測される時空間変数に対し、近過去データから近未来を逐次的に推定する技術です。

データと学習の科学

ハイレゾ・ロスレス音声符号化と超高精細ビデオ符号化による最高品質
歪みのないハイレゾ音声と超高精細映像の符号化を組みあわせ、臨場感の高いコンテンツを楽しめるようになりました。

メディアの科学

大域的最適性を保証する低ランク回帰学習技術:CFM
2次の多項式回帰を用いて組合せ数の問題と最適性の保証の問題の両方を解決する新技術Convex Factorization Machines(CFM)を考案しました。

データと学習の科学

物理乱数 Gbps ストリーミングの実現
レーザカオスと高速AD変換器、高速処理システムを融合させることで、物理乱数列を高速に生成し、ストリーミング供給することを実現しました。

メディアの科学

SPACE: 基本周波数パターン生成過程モデルに基づく韻律変換
ある話者と別の話者の基本周波数のパターンやリズムを混ぜることで、本人の声色を変えずに話し方だけを変える音声変換技術です。

メディアの科学

キネティックアバタを用いた視線を交わせるテレプレゼンス:MMSpace
動くディスプレイ上のアバタでアイコンタクトなどの非言語行動を表現することで、複数人同士の遠隔会話でも対面状況により近い形での意思疎通を可能にしました。

人間の科学

2015

眼球運動・瞳孔径に基づくマインドリーディング技術
眼の動きや瞳孔の大きさに関する独自の特徴抽出法により、好みや注意状態などを推定する技術です。

人間の科学

超未来式体感型公衆電話
お腹と背中に時間差をつけて振動をあたえると、その二つの振動の間に何かが通ったような感覚を感じる錯覚を利用した超未来型体感型電話を制作しました。

人間の科学

「ロボットは東大に入れるか(東ロボ)プロジェクト」統計的言語モデルに基づく文の自然性評価
対話処理・機械翻訳の技術を応用することで、2014年の代ゼミセンター模試において、実際の受験生の平均点を超える成績を達成しました。

コミュニケーションと計算の科学

視覚メカニズムに基づく質感の制御方法
人間は映像中の単純な特徴から質感を知覚していることを利用した質感の制御方法と、静止画像を錯覚的に動かして見せる光投影技術「変幻灯」を提案しました。

人間の科学

ひずみなし音声強調とディープラーニング新技術による高精度な音声認識技術
音声を歪ませず雑音や残響を低減する音声強調技術と、長い文脈を考慮できる音声認識技術で、公共エリア雑音下でのモバイル音声認識世界1位の精度を達成しました。

メディアの科学

ZDDを用いた動的計画法による木刈り込みに基づく文書要約の実現
二分決定グラフとよばれるデータ構造を用いて文の間の意味的な関連性を表す木構造を表現することで、一貫性のある要約文書を高速に生成する方法を実現しました。

コミュニケーションと計算の科学

2014

3GPP EVS(Enhanced Voice Services) 音声音響符号化標準規格の制定
世界中の携帯電話への適用が期待される新たに規格化された音声と音響信号の圧縮符号化技術です。2021年現在世界中のスマートフォンに搭載されています。

メディアの科学

定数ステップ量子回路の計算能力の解明
論理和関数を入力桁数によらず定数ステップで計算する量子回路を設計することに世界で初めて成功しました。

コミュニケーションと計算の科学

正解文が不要な音声認識率推定技術
人手で正解文を作成しなくても対象タスクの音声認識精度を推定できる技術で、音声認識システムの導入・運用コストの大幅な低減が期待できます。

メディアの科学

なぞって読む新デジタル文章表示方式「Yu bi Yomu」
なぞり読みの特性とデジタルデバイスの持つインタラクティブ性を利用したタブレット端末向けの新しい文章表示方式を提案しました。

人間の科学

「ぶるなび3」小型軽量の非対称振動装置による明瞭な牽引力錯覚の生成
連続的に引っ張られているように感じさせることができる錯覚応用の技術を、従来の試作機より90%以上小さく、親指サイズのバイブレータで実現しました。

人間の科学

無線センサネットワークによるオンライン環境モニタリング
センサネットワークを用いてさまざまな環境を長期間に計測・蓄積・分析することが可能になる技術です。絶滅危惧種の魚の生息環境をセンシングする実証実験を行いました。

データと学習の科学

非定常雑音下で頑健に動作する音声区間検出技術DIVIDE
低演算量かつ高精度な音声区間検出技術を、音声の周期性特徴量とスィッチングカルマンフィルタに基づき実現しました。市販ICレコーダーや音声認識に実用化されました。

メディアの科学

残響下音声認識のための残響抑圧・雑音抑圧・音声認識統合技術
残響を高精度に取り除く技術WPEと、長年培った雑音抑圧および音声認識の技術で、残響下音声認識に関する国際学会コンペティションで世界トップスコアを達成しました。

メディアの科学

2013

カメラで撮ってその場で動画検索:映像中の特定物体を検索するインスタンスサーチ技術
探したい人物、物体、場所などが映った画像や映像をクエリとして、この目的のものと同じものが映っている映像を、大量の映像の中から検索する技術です。

メディアの科学

非負値時空間分解法に基づく発話リズムの抽出
従来法(非負値行列因子分解)にはない音声に特化した制約を考慮しながら、高い精度で発話リズム(時間情報)を抽出、制御する技術です。

メディアの科学

身体の認識における聴覚の役割の発見
自分が床をたたく音が遠くで鳴ることで、無意識に自分の腕が長くなったと感じる現象を世界で初めて発見しました。

人間の科学

深層学習に基づく一体型音声認識WFST技術 “DN-soliton”
従来独立に最適化していた音響パターン及び単語の連鎖確率を、深層学習に基づき有向グラフ (WFST) 上で同時最適化することで、話し言葉音声の認識精度を大幅に向上させました。

メディアの科学

錯視からわかる脳の物体認識のしくみ
3次元物体の2次元画像をしばらく観察するだけで、その後に現れる物体の形や質感、さらにはモノの種類までもが大きく変わって見える「物体残効」錯視を発見しました。

人間の科学

2012

リーダー選挙問題を解く量子分散アルゴリズム
古典コンピュータでは有限時間内に解けないリーダ選挙問題を、量子コンピュータで構成されるネットワーク上において効率的に解くアルゴリズムを考案しました。

コミュニケーションと計算の科学

幼児の語彙爆発メカニズム現象の明確化
1歳半を過ぎると語彙を学習する速度が急に速くなる語彙爆発と呼ばれる現象を、開始時期や学習速度、語彙カテゴリ構成などから解析しました。

コミュニケーションと計算の科学

多次元複合データ分析から時空間多次元集合データ解析技術へ
Web上のデータやアプリログ、センサデータなど、複数の属性を含む多種多様なビッグデータから、データ間に現れる横断的特徴を時間や場所の関係を考慮しながら、効率的に抽出する技術です。

データと学習の科学

日本語風の英語を介した英日・日英統計翻訳
英語と日本語のような語順が大きく異なる言語間に対して、語順に並べ替えた「日本語風の」英語を介して翻訳する技術です。

コミュニケーションと計算の科学

潜在的な目と手の協調メカニズム
一流の野球・テニス選手など素早い運動修正が必要な状況での「運動準備期での協調関係の構築」という新しい協調機構を発見しました。

人間の科学

残響制御技術 Revtrina を用いた音楽サラウンド化再生
既存の2ch音楽から直接音と残響に分解し、5.1chサラウンド再生を高品質に制作できるソフトウェア(スタジオ向けと組み込み用)を世界で初めて開発し、実用化しました。

メディアの科学

2011

言語モデル識別学習技術R2D2
同じ音声認識誤りを繰り返さないように音声認識用言語モデルを識別学習する技術R2D2を提案し、話し言葉音声認識の精度を大幅に向上させました。

メディアの科学

無意識的視覚・運動系の働きによる抵抗感軽減
腕を無意識的に加速させ、ネットワークサービスの遅延に伴う遠隔操作時の抵抗感を軽減する技術です。

人間の科学

呼吸周期に合わせた音楽呈示の可能性について
呼吸タイミングを音楽に合わせたり、音楽の速度を呼吸に近づけることにより没入感のある音楽を呈示する技術です。

人間の科学

統計的手法による満足度の高い自然なインタラクションの実現
大量の人同士の対話データから自然で満足できる会話の進め方を自動的に学習する技術です。

コミュニケーションと計算の科学

大規模データを活用した高精度依存構造解析技術
大規模データを効果的に活用し、評判分析、スパムフィルタ、機械翻訳、文書要約などの自然言語解析器の性能を大きく向上させる技術です。

コミュニケーションと計算の科学

スマートフォンやWebブラウザでロバストメディア探索
スマートフォンでキャプチャした映像やWebブラウザで視聴中の映像を手がかりにしてデータベースを検索し、関連する情報を提示する技術です。

メディアの科学

ケーキを公平に分割する、役割対称なプロトコル
ケーキを複数人で平等にわける問題において、「自分の役割を相手の役割と交換したいと思わないこと」という新たな公平性を提案し、相手も自分も満足する分割プロトコルを示しました。

コミュニケーションと計算の科学

2010

温度感覚と触覚の統合メカニズムの解明

人間の科学

「いつ誰が何を話したか」を即座に認識するリアルタイム会話分析技術

メディアの科学

色と形を忠実に再現-ステレオマルチバンド画像撮影技術

メディアの科学

隠れた構造を発見する

データと学習の科学

プライバシってなんだろう?

コミュニケーションと計算の科学

腕輪型センサデバイスを用いた行動認識技術

データと学習の科学

2009

音声の残響抑圧技術:響いた音声をクッキリとした音声に

メディアの科学

対数圧伸PCMの歪みのない圧縮符号化の国際標準

メディアの科学

停止エスカレータにおける違和感に関する研究

人間の科学

錯覚体験ウェブサイト「イリュージョンフォーラム」

人間の科学

教師なし単語分割法

データと学習の科学

2008

脳内で音の地図ができるまで

人間の科学

医療情報アクセスシステム

コミュニケーションと計算の科学

世界最高速の物理乱数生成技術

メディアの科学

自然言語解析精度世界最高への挑戦-大規模未解析データの有効活用

コミュニケーションと計算の科学

世界に先駆け動画投稿サイト全投稿ファイル規模での使用コンテンツ特定の実証実験に成功

メディアの科学

2007

質感を見る脳の仕組みを解明

人間の科学

人と人との会話を解き明かす

メディアの科学

こども語辞書

コミュニケーションと計算の科学

なぜに答える質問応答システム

コミュニケーションと計算の科学

大事なものを見分ける

データと学習の科学

2006

ユーザの購買行動のモデル化

データと学習の科学

ぶるなび:錯覚を利用した牽引力生成手法

人間の科学

コンピュータを粘土のように教育用ビジュアルプログラミング言語Viscuit (ビスケット)

コミュニケーションと計算の科学

文法を学習する統計翻訳技術

コミュニケーションと計算の科学

不可能を可能にする量子情報処理技術

コミュニケーションと計算の科学

2005

ロバストメディア探索技術の考案

メディアの科学

歪みのない (ロスレス) 音響符号化の開発と国際標準化

メディアの科学

時間と空間を超える未来の電話t-room

メディアの科学

50年後の未来像「環境知能」の提案

コミュニケーションと計算の科学

クロスエントロピーに基づくネットワークの可視化技術

データと学習の科学

2004

視野の動きに誘発される反射腕運動の発見とそのメカニズムの解明

人間の科学

200万単語のリアルタイム音声認識を実現する高速アルゴリズムとベイズ的音声認識法の開発

メディアの科学

音響テレイグジスタンスロボット「テレヘッド」

人間の科学

異文化間コミュニケーション支援

コミュニケーションと計算の科学

実環境における多音源の音源分離

メディアの科学

2003

光と音のずれを自動修正

人間の科学

質問にズバリと答えるコンピュータ

コミュニケーションと計算の科学

人間の発声動作をロボットで再現

人間の科学

2002

多重分類を可能とするパラメトリック混合モデル

データと学習の科学

雑音・残響環境下で収録した人の声の基本周波数推定法

メディアの科学

余計なものは見ないようにする脳の仕組み

人間の科学

1999~2001

新しいインターネット入札/取引メカニズムに関する先駆的研究

コミュニケーションと計算の科学

メディア特徴の時系列におけるヒストグラム特徴の有効性の発見

メディアの科学

人と自然に会話するコンピュータ-DUG-1-

コミュニケーションと計算の科学

「日本語の語彙特性」と語彙数推定テスト

コミュニケーションと計算の科学

項書換え系に関する20年来の難問を解決

コミュニケーションと計算の科学

1997~1998

近似計算における「カオス的現象」をおさえる

コミュニケーションと計算の科学

ニューラルネットを用いた法則発見

データと学習の科学

速報型日英翻訳システムALTFLASH

コミュニケーションと計算の科学

遺伝的アルゴリズムを用いた最適スケジュールの自動作成

データと学習の科学

最大規模の日本語シソーラス「日本語語彙大系」

コミュニケーションと計算の科学

1994~1996

高速かつ安全な暗号を求めて

コミュニケーションと計算の科学

3次元物体の認識と学習

メディアの科学

FPGA向けの論理回路マッピング技術

コミュニケーションと計算の科学

表情豊かな音創り おっきんしゃい

メディアの科学

確定的アニーリングEM (DAEM) アルゴリズム

データと学習の科学

1991~1993

知覚の歪みに迫る理論物理学

人間の科学

論理LSI設計システムPARTHENON

コミュニケーションと計算の科学

等歪原理とその実現アルゴリズム

メディアの科学