研究広場
頑健な物体追跡のためのメモリベースパーティクルフィルタ
-
カメラなどにより撮影された画像中の人や物の状態(位置や姿勢など)を推定する研究は対象追跡と呼ばれ監視カメラなど様々な分野で盛んに行われています。対象追跡にはパーティクルフィルタ(PF)が広く用いられています。PFでは、各時刻において、入力画像を用いた状態の更新と次時刻における状態の予測とを繰り返し行います。従来のPFでは対象に急激な速度変化があると、状態の予測が困難となり、しばしば追跡に失敗します。この問題の解決策として我々は、メモリベースパーティクルフィルタ(M-PF)を提案しています。M-PFでは、過去の履歴に含まれる長期の動きの性質に基づいて対象の未来の状態を予測します。提案手法は、従来法の単純マルコフ性を仮定したダイナミクスモデルでは取り扱うことができなかった長期的なダイナミクスを反映した予測を行うことができ、予測対象の急激な動きや、対象を見失った際の復帰において高い性能を発揮します。
聴覚における知覚の形成と選択に関わる脳内ネットワークの解明
-
私たちは、オーケストラによる演奏を渾然一体の音楽として楽しんだり、それぞれの楽器の音色に注意を向けたりすることができます。しかし、このような知覚がどのように脳内で形成されて選択されるのか、明確ではありませんでした。そこで我々は、錯聴現象と脳機能計測を組み合わせて、この問題を解明しようと取り組みました。その結果、知覚の形成に複数の脳内領域が関与しており、それらの活動のバランスが知覚の選択に重要であることを発見しました。これらの研究成果は、主観的な知覚を客観的に捉える手法を提供するとともに、知覚の個人差を考慮した音響システムやコンテンツの開発につながると期待されます。
センサで分かる人の日常行動
-
人が実世界で行っている行動を理解することは、実世界指向のアプリケーションを実現するための要素技術の一つです。本研究では、カメラ、マイク、加速度センサなどを搭載するセンサデバイスを手首に装着するだけで、人の日常行動を認識する手法を開発しました。
センサデバイスは、ユーザが手で持っているモノを撮影するように設置されたカメラを備えることを特徴とし、これにより、「コーヒーを作る」、「水やりをする」などのモノを用いた複雑な行動の認識が可能となります。
既存のウェアラブルセンサを用いた行動認識の研究では、加速度センサなどを用いて手の動きの情報しか捉えていなかったため、このような行動の認識は困難でした。
詳しくはこちらのページをご覧ください。
スパース表現に基づく音響信号処理 ―複素NMFと複合自己回帰分析法―
-
実世界の音源から生成される音響信号は一見すると多様な波形として観測されますが、例えば、人の声には/a/や/i/等といった音素単位の要素があり、ピアノの演奏には音階単位の要素があるように、ある空間や量に着目すると限られた数の基本要素だけで構成されていると見ることができます。 本研究では、事前には未知な信号の基本要素を自律的に学習するスパース表現と呼ぶアプローチにより、このような仮定をもとに分析を行う,新しい音響信号処理分野の開拓に取り組んでいます。私たちはこれまでに、複素NMFと複合自己回帰分析法と呼ぶ上記の考
え方をベースとした 2つの信号解析法を考案しました。
知覚の不思議 -運動が知覚に影響する-
-
私たちが日ごろ行動するうえで、刻々と変化する体の状態や動きを知覚しておくことは不可欠です。この"身体知覚"は、体性感覚や視覚などの感覚情報を脳内で統合して形成されると長らく考えられてきました。しかしながら、近年の我々の研究から、身体知覚には体を動かすための情報(運動指令情報)も関わっていることがわかってきました。運動中の感覚情報が不確かな場合には(例えば、手がしびれているとき)、運動指令情報がそれを補うように利用されるのです。このような知見は、運動と知覚のインタラクションを利用した新しいインタフェースの創出へとつながります。
ロスレス・オーディオ符号化とアーカイブフォーマットの国際標準化
-
研究所ではオーディオ信号に対する歪のない圧縮符号化(ロスレス符号化)の技術を研究し、国際標準規格MPEG-4 ALS*(ISO/IEC 14496-3)の制定に貢献してきました。さらにロスレス符号化の重要な応用の一つであるアーカイブシステムに必要となるファイルフォーマットを設計しました。このフォーマットはこのたび参照ソフトも含めて国際規格MPEG-A PA-AF**(ISO/IEC 23000-6)として承認される運びとなりました。これらの2つの規格は国際標準としての相互接続性、長期保守性の利点を生かし、個別にあるいは組み合わせてアーカイブなどの長期保存、高品質音響信号の蓄積、伝送、編集、再生など柔軟に活用いただけます。詳しくはこちらのページをご覧ください。
*ALS:Audio Lossless Coding
**PA-AF: Professional Archival Application Format
動画像中の動きのパターンを学習する複数対象トラッキング技術
-
近年、セキュリティ意識の高まりを受けて、日常生活の様々な場面で監視カメラによる安全対策が実施されています。
監視カメラで撮影される動画像シーンの中では多数の人物が様々な行動をとっています。
しかし、これらの情報の大部分は人間の目視による理解はなく、ビデオテープの中に埋もれたままです。
我々は動画像データからの情報マイニング研究の一環として、動画像中の複数対象を追跡しながらそれぞれの運動パターン(右に歩く、左上に走る、など)を自動的に学習・認識する数理モデルを開発しました。
我々のモデルは動画像シーンを見れば見るほど、シーン内で起こる運動を賢く認識し、より正確に追跡できるようになります。
この技術をさらに発展させることで、より一般の動画像コンテンツの自動理解エンジン開発につなげたいと考えています。
詳しくはこちらのページをご覧ください。
ダイナミカル情報処理システム-複雑に変動する環境に調和した通信の科学
-
絶えず渦まきながら変化を続ける川の流れのように、自然界は複雑で予測不可能な現象で満ちています。これまであまり応用されることのなかったこのような複雑ダイナミクスを解明し、情報通信技術に応用することが私たちの研究テーマです。そのような複雑ダイナミクスは様々な最先端デバイスでも見ることができますが、通信に最も近いものはレーザの複雑現象であると言ってよいでしょう。例えば、レーザにおいても、出力光のフィードバックにより、出力光強度が複雑に変化し続ける現象が生じます。
このレーザの戻り光カオスとよばれる複雑で予測不可能な現象は、そのメカニズムに関する知見を利用することで制御が可能です。つまり、他の方法では実現不可能ないわば制御された複雑な信号を発生させることができます。そこで私たちは、この信号発生方法と情報理論を組み合わせることで全く新しい秘密鍵共有方式を提案し、その実現に向けて研究開発を推進しています。
また、レーザの戻り光カオスを利用した物理乱数生成技術の研究に取り組んでいます。物理乱数とは、サイコロを振って出る目のように、再現性のないランダム物理現象からつくられる数のことです。レーザの戻り光カオスには、複雑な現象が非常に高速で起きるという特徴があります。私たちは、拓殖大学との共同研究により、世界で初めてこの現象を応用し、物理乱数生成器として世界最高速の毎秒1.7ギガビットという乱数生成レートを達成することに成功しました。本成果は、Nature Photonics Vol.2, No.12 (2008) pp. 728-732に掲載されると共に、同誌で"The world's fastest dice"(世界一速いサイコロ)として紹介されました。 このような物理乱数生成速度の飛躍的な向上は、暗号や数値計算の世界に大きな変革をもたらすことでしょう。
詳しくはこちらをご覧下さい。
~イリュージョンフォーラム~ 目や耳の錯覚を楽しむウェブサイト
-
目や耳の錯覚現象が紹介される際に、「このように人間の感覚はとても不正確な
のです」といった説明がなされることがあります。しかし私たちは、こういった
説明は誤った見方であると考えます。人間の視覚や聴覚の仕組みは、ヒトが生き
残るために、進化の過程で、きわめて巧妙に形作られてきました。そのような素
晴らしい仕組みの一端をかいま見ることができる体験、それが「錯覚」体験なの
です。「錯覚」の研究によって、脳の仕組みについて多くのことが明らかになっ
ています。錯覚や脳の情報を驚きとともに皆様と共有したい、という願いから、
このウェブサイトを作りました。こちらにアクセスして、ご体験ください。
~ぶるなび~ 非接地で牽引力を錯覚させる力覚提示装置
-
人間の触覚や固有感覚の知覚特性を利用することで、外部に対して非固定にも関わらず時間的に安定した牽引力を知覚させる方法を発見し、その装置を開発しました。具体的には行きと帰りの加速度が大きく異なる非対称な加速度を生成する機構を用いて、一方向には強く、もう一方向には弱い加速度を周期的に作り出します。弱い力を感じさせない値を用いることで、物理的には2方向に生成している力を一方向のみの力のように錯覚させます。詳しくはこちらをご覧下さい。
身の回りの音や映像を特定する「ロバストメディア探索技術」
- 街なかでふと耳にした音楽の曲名、テレビに映っているものの情報などのように、文字で書けないものについて調べたいとき、身の回りの音や映像を元にして情報を検索できれば便利ではないでしょうか。私たちが研究を進めている高速メディア探索は、私たちの目や耳に直接触れる映像や音、つまりメディア情報と、日々増大を続ける情報世界とをつなぐキー技術の一つです。私たちが近年力を注いできたのは、周囲の雑音や、携帯電話やカメラなどを通すことによる信号の歪みの克服です。この問題に対して、私たちはロバストメディア探索技術を提案しました。ロバストメディア探索技術では、メディア情報からの特徴抽出と、抽出した特徴の照合の双方における独自の工夫により、例えば映像探索の場合、解像度、色の変化、遮蔽、画像のゆがみなどが存在する条件下においても、従来の方法に比べて著しい精度向上を実現しました。詳しくはこちらをご覧下さい。