メディアとコミュニケーション

知らない音も書き起こす

~ベイジアン半教師あり音響イベント認識~

概要

本展示では,音響信号に含まれる音響イベント(声や音楽,効果音や環境音など,音によって人に認識される事象)を書き起こす技術を紹介します.重なり合った音響イベントの区間を特定するとともに,音響信号に存在しうる音響イベントの数を学習することで,学習データに無い音を,「知らない音(未知の音響イベント)」として検出できます.人間の耳のように,どんな音が,どこで,どんな風に鳴っているかを聞き分けて認識することで,クラウドにおける大量の音コンテンツの可視化を目指します.これにより,特定の音を含む動画コンテンツ検索や危険な音を知らせてくれる監視・行動支援システムなど,様々な応用が期待されます.

ポスター


ポスターの画像をクリックすると,PDFファイルが開きます.

資料一覧

  1. Y, Ohishi, D. Mochihashi, T. Matsui, M. Nakano, H. Kameoka, T. Izumitani, K. Kashino, “Bayesian semi-supervised audio event transcription based on Markov Indian buffet process,” in Proc. 38th International Conference on Acoustics, Speech, and Signal Processing (ICASSP) 2013.
  2. 大石康智, 持橋大地, 松井知子, 中野允裕, 亀岡弘和, 泉谷知範, 柏野邦夫, “mIBPに基づくベイジアン半教師付き音響イベントダイアライゼーション,” 日本音響学会2013年春季研究発表会, 1-9-6, pp. 19-22, 2013.

展示担当者

大石 康智
大石 康智
メディア情報研究部
中野 允裕
中野 允裕
メディア情報研究部
亀岡 弘和
亀岡 弘和
メディア情報研究部
泉谷 知範
泉谷 知範
メディア情報研究部
柏野 邦夫
柏野 邦夫
メディア情報研究部