フィンガープリント技術
投稿コンテンツモニタリング共同実験
投稿サイトなどネット上でメディアコンテンツ(音楽や映像など)の流通が盛んになる中,メディアコンテンツを特定することができれば色々な応用が広がります.我々が開発した「RMS技術」で,ネット上に投稿される音楽や映像などのタイトルを特定する実験を,BayTSP社と共同で開始しました.詳細は以下をご覧下さい.
https://group.ntt/jp/newsrelease/pdf/news08/0804/080422a.pdf
プロファイリング技術
複合ソーフィルタモデルによる音響信号の三要素特徴量分解
次世代のメディア探索の実現に向けて,まず音メディアを対象として,人間と
同等以上の音響信号理解能力を有する計算機の実現を目指しています.我々は,
多重音信号から「どのような音」が「どのように混合」されているかを推定す
るブラインド問題をスパースコーディングスタイルのアプローチにより解決す
る新しい技術を開発しています.詳細は以下をご覧下さい.
- 亀岡弘和, 柏野邦夫, “複合ソースフィルタモデルによる音響信号の三要素テン
ソル分解,” 電子情報通信学会2008年総合大会講演論文集, AS-5-5, pp. S56-S57,
2008.
映像の知覚的重要度の確率モデル
人間は,視覚的注意と呼ばれるメカニズムにより,網膜に写る映像の中から重
要と思われる情報を瞬時に判断して,効率的に情報を獲得しています.そこで
我々は,この視覚的注意を説明する新しい確率的モデルを導入することで,与
えられた映像のみからその映像を人間が視聴したときに視線を向ける可能性が
高い箇所を自動推定できる技術を開発しています.詳細は以下をご覧下さい.
- Derek Pang, Akisato Kimura, Tatsuto Takeuchi, Junji Yamato and Kunio
Kashino, "A Stochastic Model of Selective Visual Attention with a
Dynamic Bayesian Network," International Conference on Multimedia and
Expo (ICME2008), to appear, June 2008.
和文:http://www.brl.ntt.co.jp/people/akisato/saliency2-j.html
英文:http://www.brl.ntt.co.jp/people/akisato/saliency2.html
音楽使用区間検出
音楽コンテンツの著作権管理を効率的に行うためには,音楽以外の区間を多く
含む長時間のオーディオデータの中で音楽が使用されている区間を精度良く検
出することが求められます.我々は,音階状に配置したフィルタと2次の識別
学習に基づいて音楽に表れやすい音のパターンを獲得し,各時刻に音楽が含ま
れるかどうかを判定する技術を開発しています.詳細は以下をご覧下さい.
- Tomonori Izumitani, Ryo Mukai and Kunio Kashino, "A Background Music
Detection Method Based on Robust Feature Extraction," In Proc. 2008
IEEE International Conference on Acoustics, Speech and Signal Processing
(ICASSP2008), pp. 13-16, 2008.