柏野 研究室
東京大学大学院 情報理工学系研究科 システム情報学専攻 (2020年3月まで)
※当研究室は2015年から5年間活動し,2020年3月末に所定の設置期間が満了しました。同4月より,
メンバーは同専攻第1研究室に移行し,柏野は共同研究契約に基づき引き続き研究活動にあたっています。
当研究室では,音・画像・動画等のメディアデータの解析、探索・認識、および生成・変換に関する研究を行っています。これにより,膨大かつ多様なメディアデータの活用に基づく新たな価値創造や問題解決,メディアデータを介して精神的充足感を共有できるような質の高いコミュニケーションやインタフェースの実現を目指します。
当研究室の学生の皆さんには,社会の状況や研究分野の動向について考察を深め,課題を抽出して,解くべき問題自体を新たに設定するプロセスも含めて経験して頂いています。
(1) クロスメディア解析
メディアデータに潜在的に含まれている有益な情報を取り出すための技術体系を構築する。
(2) メディア探索・認識
大量のメディアデータを効率的かつ多面的に扱うための技術基盤を構築する。
(3) メディア生成
メディア解析技術に根差した斬新なメディアデータの生成・変換・提示技術を提案する。
2020年まで
柏野 邦夫 客員教授
竹内 博俊
2019年修了
井川 翔太
2018年修了
佐藤 遼太郎
Shota Ikawa, Kunio Kashino: DCASE Workshop Best Paper Award (2019).
井川 翔太: 日本音響学会 第18回学生優秀発表賞 (2019).
佐藤 遼太郎: 電子情報通信学会 音声研究会 2016年度学生ポスター賞 (2016).
- Shota Ikawa, Kunio Kashino:
"Neural audio captioning based on conditional sequence-to-sequence model",
Proceedings of the Detection and Classification of Acoustic Scenes and Events 2019 Workshop (DCASE) (Oct. 2019).
- Shota Ikawa, Kunio Kashino:
"Acoustic event search with an onomatopoeic query:
measuring distance between onomatopoeic words and sounds",
Proceedings of the Detection and Classification of Acoustic
Scenes and Events 2018 Workshop (DCASE), pp.59-63 (Nov. 2018).
- Shota Ikawa, Kunio Kashino:
"Generating sound words from audio signals of acoustic events
with sequence-to-sequence model",
IEEE International Conference on Acoustics,
Speech and Signal Processing (ICASSP) (Apr. 2018).
- Ryotaro Sato, Kunio Kashino:
"Statistical phrase/accent command estimation algorithm
utilizing linguistic information",
IEEE International Conference on Acoustics,
Speech and Signal Processing (ICASSP) (Apr. 2018).
- Ryotaro Sato, Hirokazu Kameoka, Kunio Kashino:
"Fast algorithm for statistical phrase/accent command estimation
based on generative model incorporating spectral features",
IEEE International Conference on Acoustics,
Speech and Signal Processing (ICASSP), pp.5595-5599 (Mar. 2017).
- 井川翔太, 柏野邦夫:
"擬音語をクエリとした潜在特徴に基づく音響信号検索",
日本音響学会研究発表会講演論文集 (Sep. 2018).
(学生優秀発表賞受賞)
- 佐藤遼太郎, 柏野邦夫:
"韻律指令列の統計的推定アルゴリズムへの言語情報の導入",
日本音響学会研究発表会講演論文集 (Mar. 2018).
- 井川翔太, 柏野邦夫:
"Sequence-to-Sequence モデルによる音響信号からの擬音語生成と主観評価"
日本音響学会研究発表会講演論文集 (Mar. 2018).
- 井川翔太, 柏野邦夫:
"LSTM を用いた音響信号からの擬音語生成"
電子情報通信学会技術研究報告, Vol. SP-117, no.368, pp.17-20 (Dec. 2017).
- 佐藤遼太郎, 亀岡弘和, 柏野邦夫:
"韻律指令列推定のための基本周波数・音韻特徴量系列同時生成モデルの検討",
日本音響学会研究発表会講演論文集 (Mar. 2017).
- 佐藤遼太郎, 亀岡弘和, 柏野邦夫:
"基本周波数パターンと音韻特徴量系列の同時生成モデルによる韻律指令列推定",
電子情報通信学会技術研究報告 (第18回音声言語シンポジウム),
vol.SP-116, no.378, pp.43-48 (Dec. 2016).
(学生ポスター賞受賞)
ページの先頭へ戻る
|