フィンガープリント技術

投稿コンテンツモニタリング共同実験

投稿サイトなどネット上でメディアコンテンツ（音楽や映像など）の流通が盛んになる中，メディアコンテンツを特定することができれば色々な応用が広がります．我々が開発した「RMS技術」で，ネット上に投稿される音楽や映像などのタイトルを特定する実験を，BayTSP社と共同で開始しました．詳細は以下をご覧下さい．
https://group.ntt/jp/newsrelease/pdf/news08/0804/080422a.pdf

プロファイリング技術

複合ソーフィルタモデルによる音響信号の三要素特徴量分解

次世代のメディア探索の実現に向けて，まず音メディアを対象として，人間と同等以上の音響信号理解能力を有する計算機の実現を目指しています．我々は，多重音信号から「どのような音」が「どのように混合」されているかを推定するブラインド問題をスパースコーディングスタイルのアプローチにより解決する新しい技術を開発しています．詳細は以下をご覧下さい．

亀岡弘和, 柏野邦夫, “複合ソースフィルタモデルによる音響信号の三要素テンソル分解,” 電子情報通信学会2008年総合大会講演論文集, AS-5-5, pp. S56-S57, 2008.

映像の知覚的重要度の確率モデル

人間は，視覚的注意と呼ばれるメカニズムにより，網膜に写る映像の中から重要と思われる情報を瞬時に判断して，効率的に情報を獲得しています．そこで我々は，この視覚的注意を説明する新しい確率的モデルを導入することで，与えられた映像のみからその映像を人間が視聴したときに視線を向ける可能性が高い箇所を自動推定できる技術を開発しています．詳細は以下をご覧下さい．

Derek Pang, Akisato Kimura, Tatsuto Takeuchi, Junji Yamato and Kunio Kashino, "A Stochastic Model of Selective Visual Attention with a Dynamic Bayesian Network," International Conference on Multimedia and Expo (ICME2008), to appear, June 2008.

和文：http://www.brl.ntt.co.jp/people/akisato/saliency2-j.html
英文：http://www.brl.ntt.co.jp/people/akisato/saliency2.html

音楽使用区間検出

音楽コンテンツの著作権管理を効率的に行うためには，音楽以外の区間を多く含む長時間のオーディオデータの中で音楽が使用されている区間を精度良く検出することが求められます．我々は，音階状に配置したフィルタと２次の識別学習に基づいて音楽に表れやすい音のパターンを獲得し，各時刻に音楽が含まれるかどうかを判定する技術を開発しています．詳細は以下をご覧下さい．

Tomonori Izumitani, Ryo Mukai and Kunio Kashino, "A Background Music Detection Method Based on Robust Feature Extraction," In Proc. 2008 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP2008), pp. 13-16, 2008.