信号処理研究グループ
コンテンツ
トップページ
研究トピックス
メンバーリスト
発表文献
組織
NTTコミュニケーション科学基礎研究所
メディア情報研究部
メディア認識研究グループ
Signal Processing Research Group
コミュニケーション環境研究
協創情報研究部
人間情報研究部
守谷特別研究室
リンク
先端技術総合研究所
NTT

| 2011 | 2010 | 2009 | 2008 | 2007 | 2006 | 2005 | 2004 | 2003 | 2002 | 2001 | 2000 |

発表文献

2009

論文

  1. T. Yoshioka, T. Nakatani, and M. Miyoshi, “Integrated speech enhancement method using noise suppression and dereverberation,” IEEE Transactions on Audio, Speech and Language Processing, vol. 17, no. 2, pp. 231-246, February. 2009.
  2. 中谷 智広, 吉岡 拓也, 木下 慶介, 三好 正人, “時変ガウス音源モデルと多チャンネル自己回帰観測モデルに基づく最ゆう法による音響信号の残響除去,” 電子情報通信学会論文誌 A, vol. J92-A, no. 5, pp. 294-304, May, 2009.
  3. S. Miyake, and J. Muramatsu, “A Construction of Channel Code, Joint Source-Channel Code, and Universal Code for Arbitrary Stationary Memoryless Channels using Sparse Matrices,” IEICE Transactions on Fundamentals, vol.E92-A, no.9, pp.2333-2344, September. 2009.
  4. H. K. Solvang, Y. Nagahara, S. Araki, H. Sawada and S. Makino, “Frequency-Domain Pearson Distribution Approach for Independent Component Analysis (FD-Pearson-ICA) in Blind Source Separation,” IEEE Trans. Speech & Language Processing, vol, 17, no. 4, pp. 639-649, 2009.
  5. K. Kinoshita, M. Delcroix, T. Nakatani and M. Miyoshi, “Suppression of late reverberation effect on speech signal using long-term multiple-step linear prediction” IEEE Transactions on Audio, Speech and Language processing
  6. M. Delcroix, T. Nakatani, and S. Watanabe, “Static and dynamic variance compensation for recognition of reverberant speech with dereverberation pre-processing,” IEEE transactions on Audio, Speech, and Language Processing, vol. 17, issue 2, pp. 324-334, 2009.
  7. S. Araki, H. Sawada, R. Mukai and S. Makino, “DOA estimation for multiple sparse sources with arbitrarily arranged multiple sensors,” Journal of Signal Processing Systems, doi:10.1007/s11265-009-0413-9, 2009.
  8. 村松純, 三宅茂樹 “疎行列アンサンブルのハッシュ性と多端子情報源符号,” 統計数理, vol.57, no.2, pp.203-219, 2009.

書籍, 解説記事

  1. T. Hori, K. Sudoh, H. Tsukada, and A. Nakamura, “World-Wide Media Browser--Multilingual Audio-visual Content Retrieval and Browsing System,” NTT Technical Review, Vol. 7, No. 2, February 2009.
  2. 堀 貴明, 須藤 克仁, 塚田 元, 中村 篤, “世界メディアブラウザ,” NTT技術ジャーナル 2009年5月号.
  3. 堀 貴明, 村松 純 “日本企業から米国・欧州大学への派遣体験 〜米国マサチューセッツ工科大学/スイス連邦チューリヒ工科大学編〜,” 電子情報通信学会誌, pp.400-404, 2009.
  4. S. Makino, S. Araki, S. Winter, H. Sawada, “Underdetermined Blind Source Separation using Acoustic Arrays,” Handbook on Array Processing and Sensor Networks, S. Haykin, and K. J. R. Liu Eds., Wiley, 2009 (in press).
  5. 石塚健太郎, 藤本雅清, 中谷智広, “音声区間検出技術の最近の研究動向,” 日本音響学会誌, Vol.52, No.10, pp.537-543, 2009.

国際会議予稿

  1. T. Yoshioka, H. Tachibana, T. Nakatani, and M. Miyoshi, “Adaptive dereverberation of speech signals with speaker-position change detection,” in Proceedings of the 2009 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2009), pp. 3733-3736, April 2009.
  2. H. Kameoka, T. Nakatani, and T. Yoshioka, “Robust speech dereverberation based on non-negativity and sparse nature of speech spectrograms,” in Proceedings of the 2009 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2009), pp. 45-48, April 2009.
  3. T. Nakatnai, T. Yoshioka, K. Kinoshita, M. Miyoshi, and B.-H. Juang, “Real-time speech enhancement in noisy reverberant multi-talker environments based on a localtion-independent room acoustics model,” to appear in Proceedings of the 2009 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2009), pp. 137-140, April 2009.
  4. A. Ogawa, S. Takahashi, and A. Nakamura, “Efficient combination of likelihood recycling and batch calculation based on conditional fast processing and acoustic back-off,” Proc. ICASSP, pp. 4164-4164, April 2009.
  5. T. Yoshioka, T. Nakatani, and M. Miyoshi, “Fast algorithm for conditional separation and dereverberation,” in Proceedings of the 17th European Signal Processing Conference (EUSIPCO 2009), CD-ROM Proceedings, August 2009.
  6. A. Ogawa and A. Nakamura, “Simultaneous estimation of confidence and error cause in speech recognition using discriminative model,” Proc. Interspeech, pp. 1199-1202, September 2009.
  7. S. Kobashikawa, A. Ogawa, Y. Yamaguchi, and S. Takahashi, “Rapid unsupervised adaptation using frame independent output probabilities of gender and context independent phoneme models,” Proc. Interspeech, pp.1615-1618, September 2009.
  8. T. Yoshioka, H. Kameoka, T. Nakatani, and H. G. Okuno, “Statistical models for speech dereverberation,” in Proceedings of the 2009 IEEE Workshop on Applications of Signal Processing to Audio and Acoustics (WASPAA 2009), pp. 145-148, October 2009.
  9. A. Nakamura, E. McDermott, S. Watanabe, S. Katagiri, “A unified view for discriminative objective functions based on negative exponential of difference measure between strings,” Proc. ICASSP 2009, pp. 1633-1636, 2009.
  10. E. McDermott, S. Watanabe, and A. Nakamura, “Margin-Space Integration of MPE Loss via Differencing of MMI Functionals for Generalized Error-Weighted Discriminative Training,” Proc. Interspeech 2009 Eurospeech, pp. 224-227, 2009.
  11. E. Vincent (IRISA-INRIA), S. Araki, and P. Bofill (カタロニア工科大), “The 2008 Signal Separation Evaluation Campaign: A Community-Based Approach to Large-Scale Evaluation,” ICA2009, pp. 734-741, 2009.
  12. J. Muramatsu, and S. Miyake, “Coding theorem for general stationary memryless channel based on hash property,” Proceedings of the 2009 IEEE International Symposium on Information Theory, Seoul, Korea, pp.541-545, 2009.
  13. J. Muramatsu, and S. Miyake, “Construction of wiretap channel codes by using sparse matrices,” Proceedings of the 2009 IEEE Information Theory Workshop, Taormina, Italy, pp.105-109, 2009.
  14. K. Ishiguro, T. Yamada S. Araki and T. Nakatani, “A PROBABILISTIC SPEAKER CLUSTERING FOR DOA-BASED DIARIZATION,,” WASPAA2009, 2009.
  15. K. Ishizuka, S. Araki, K. Otsuka, T. Nakatani and M. Fujimoto, “A Speaker Diarization Method based on the Probabilistic Fusion of Audio-Visual Location Information,” ICMI-MLMI 2009, 2009.
  16. K. Ishizuka, S. Araki, K. Otsuka, T. Nakatani, and M. Fujimoto, “A speaker diarization method based on the probabilistic fusion of audio-visual location information,” Proceedings of the 11th International Conference on Multimodal Interfaces and Workshop on Machine Learning for Multi-modal Interaction (ICMI-MLMI2009), pp.55-62, 2009.
  17. K. Otsuka, S. Araki, D. Mikami, K. Ishizuka, M. Fujimoto, and J. Yamato, “Realtime meeting analysis and 3D meeting viewer based on omnidirectional multimodal sensors,” Proceedings of the 11th International Conference on Multimodal Interfaces and Workshop on Machine Learning for Multi-modal Interaction (ICMI-MLMI2009), pp.219-220, 2009.
  18. M. Fujimoto, K. Ishizuka, and T. Nakatani, “A study of mutual front-end processing method based on statistical model for noise robust speech recognition,” Proc. of Interspeech '09, pp. 1235-1238, September 2009.
  19. M. Fujimoto, K. Ishizuka, and T. Nakatani, “A study of mutual front-end processing method based on statistical model for noise robust speech recognition,” Proceedings of the 10th Interspeech (Interspeech2009), pp. 1235-1238, 2009.
  20. R. Mugitani, K. Ishizuka, T. Kondo, and S. Amano, “Acquisition of durational control of vocalic and consonantal intervals in speech production,” The 34th Boston University Conference on Language Development (BUCLD34), 2009.
  21. S. Araki, T. Nakatani, H. Sawada, and S. Makino, “Blind sparse source separation for unknown number of sources using Gaussian mixture model fitting with Dirichlet prior,” ICASSP2009, pp.33-36, 2009.
  22. S. Araki, T. Nakatani, H. Sawada, and S. Makino, “Stereo source separation and source counting with MAP estimation with Dirichlet prior considering spatial aliasing problem,” ICA2009, pp. 742-750, 2009.
  23. S. Watanabe and A. Nakamura, “Speech recognition with incremental tracking and detection of changing environments based on a macroscopic time evolution system,” Proc. ICASSP 2009, pp. 4373-4376, 2009.
  24. T. Iwata, S. Watanabe, T. Yamada, and N. Ueda, “Topic tracking model for analyzing consumer purchase behavior,” IJCAI 2009, pp. 1427-1432, 2009.
  25. T. Tashiro(AS研), S. Araki, Y. Nakanishi(NTT東), H. Kimura(AS研), K. Kumozaki(AS研) and M. Miyoshi, “Optical Access System with Emergency Voice Communication Using Blind Speech Separation for Demultiplexing Randomly Mixed Signals,” GLOBECOM, 2009.
  26. Y. Izumi, K. Nishiki, S. Watanabe, T. Nishimoto, N. Ono, and S. Sagayama, “Stereo-input Speech Recognition using Sparseness-based Time-frequency Masking in a Reverberant Environment,” Proc. Interspeech 2009 Eurospeech , pp. 1955-1958, 2009.
  27. S. Kobashikawa, A. Ogawa, Y. Yamaguchi, and S. Takahashi, “Rapid unsupervised adaptation using context independent phoneme model,” The 13th IEEE International Symposium on Consumer Electronics (ISCE'09), 2009.

その他会議予稿

  1. 藤本 雅清, 石塚 健太郎, 中谷 智広, “確率モデルに基づく音声区間検出法における音声ゲイン補正の検討,” 日本音響学会, 平成21年度春季研究発表会, 1-5-2, pp. 3-6, March 2009.
  2. 渡辺秀行, 片桐 滋, 山田 幸太, 中村 篤, マクダーモット エリック, 渡部 晋治, 谷口 真一, 西島 奈甫, 大崎 美穂, “アンサンブル型最小分類誤り学習の提案” 信学技報, vol. 108, no. 484, PRMU2008-250, pp. 71-76, March 2009.
  3. D. Cournapeau, S. Watanabe, A. Nakamura, and T. Kawahara, “Using online free energy for model comparison with application to voice activity detection,” 音響学会講演論文集, 2-5-14, March 2009.
  4. 久保 陽太郎, 渡部 晋治, 中村 篤, 白井 克彦, “最小相対エントロピー基準によるパラメタ分布の正則化を用いた連続分布HMM の識別学習,” 音響学会講演論文集, 2-5-16, March 2009.
  5. 小川厚徳,中村篤, “最大エントロピーモデルに基づく信頼度と誤認識原因の同時推定,” 音講論集,2-5-17, March 2009.
  6. 小橋川哲,小川厚徳,山口義和,高橋敏, “音素環境独立モデルに基づく高速教師なし適応の検討,” 音講論集,1-P-30, March 2009.
  7. 渡部 晋治, “[招待講演] 音響モデルのベイズ学習,” 情報処理学会研究報告, Vol.2009-SLP-77, No. 9, July 2009.
  8. 久保 陽太郎, 渡部 晋治, 中村 篤, マクダーモット エリック, 小林 哲則, “最小相対エントロピー識別学習に基づくカーネルマシンを利用した音声認識,” 情報処理学会研究報告, Vol.2009-SLP-77, No.6, July 2009.
  9. 山田 幸太, 片桐 滋,マクダーモット エリック, 渡辺 秀行, 中村 篤, 渡部 晋治, 大崎 美穂 “最小分類誤り学習における幾何マージンの制御法について,” 信学技報, vol. 109, no. 139, SP2009-43, pp. 13-18, July 2009.
  10. 渡辺 秀行, 片桐 滋, 山田 幸太, マクダーモット エリック, 中村 篤, 渡部 晋治, 大崎 美穂, “判別関数の一般形に対する幾何マージンの導出とその制御を伴う最小分類誤り学習,” 信学技報, vol. 109, no. 182, PRMU2009-60, pp. 1-6, August 2009.
  11. 吉岡 拓也, 亀岡 弘和, 中谷 智広, 奥乃 博, “少量データに頑健な残響抑圧のためのMSPP法,” 日本音響学会 2009年秋季研究発表会講演論文集, 2-4-1, pp. 609-612, September 2009.
  12. 吉岡 拓也, 中谷 智広, 奥乃 博, “重みつき予測誤差法におけるMIMO残響除去フィルタの効率的最適化法,” 日本音響学会 2009年秋季研究発表会講演論文集, 2-4-17, pp. 651-654, September 2009.
  13. 藤本 雅清, 中谷 智広, “確率モデルに基づく音声区間検出法における確率分布選択と確率重み付けの検討,” 日本音響学会, 平成21年度秋季研究発表会, 1-1-14, pp. 43-46, September 2009.
  14. 渡部 晋治, 岩田 具治, 堀 貴明, 佐古 淳, 有木 康雄, “話題追従型言語モデルについての考察,” 音響学会講演論文集, 2-1-3, September 2009.
  15. 久保 陽太郎, 渡部 晋治, 中村 篤, マクダーモット エリック, 小林哲則, “隠れマルコフモデルの最小相対エントロピー識別学習則より導出されるカーネルマシンを用いた音声認識,” 音響学会講演論文集, 1-1-4, September 9.
  16. 堀 貴明, 渡部 晋治, 中村 篤, “サーチエラーリスク最小化に基づくビーム探索,” 音響学会講演論文集, 3-1-8, September 2009.
  17. 大庭隆伸, 堀貴明, 中村篤, “誤り訂正言語モデルのシンボル系列重み付き学習法に関する考察,” 音響学会講演論文集, pp. 179-180, September 2009.
  18. 藤本 雅清, 渡部 晋治, 中谷 智広, “Dirichlet事前分布を用いた音声区間検出の検討,” 情報処理学会研究報告, SLP-79-12, December 2009.
  19. 堀 貴明, 渡部 晋治, 中村 篤, “サーチエラーリスク最小化に基づくViterbiビーム探索とその評価,” 第11回音声言語シンポジウム,SP2009-79, pp.31-36, December 2009
  20. 藤本 雅清, 渡部 晋治, 中谷 智広, “Dirichlet事前分布を用いた音声区間検出の検討,” 情報処理学会研究報告, Vol.2009-SLP-79 No.12, December 2009.
  21. K. Kinoshita, T. Nakatani, M. Miyoshi and T. Kubota, “Blind upmix of stereo music signal using multi-step linear prediction based reverberation extraction,” International Conference on Acoustics, Speech, and Signal Processing(ICASSP), pp49-52, 2009
  22. 久保 陽太郎, 渡部 晋治, 中村 篤, マクダーモット エリック, 小林哲則, “隠れマルコフカーネルマシンを用いた系列データの識別とその音素認識タスクへの適用,” 第12回情報論的学習理論IBIS2009, P106.
  23. 荒木, 中谷, 澤田, “ディリクレ事前分布を用いた音声のスパース性に基づく音源数推定と音源分離,” 日本音響学会2009年秋季研究発表会, 2009.
  24. 小笠原(名大), 石塚, 荒木, 藤本, 中谷, 大塚, “SN 比最大化ビームフォーマを用いたオンライン会議音声強調,” 日本音響学会2009年春季研究発表会, 2009.
  25. 小笠原基, 石塚健太郎, 荒木章子, 藤本雅清, 中谷智広, 大塚和弘, “SN比最大化ビームフォーマを用いたオンライン会議音声強調,” 日本音響学会講演論文集, 2-9-17, 春季, pp.695-698, 2009.
  26. 石黒, 山田, 荒木, 中谷, “ノンパラメトリックベイズを用いた会議音声話者識別のための話者クラスタリング法,” 日本音響学会2009年春季研究発表会, pp.107-110, 2009.
  27. 石塚, 荒木, 大塚, 中谷, 藤本, “音響情報と映像情報から得られる位置情報の統合による話者ダイアライゼーション,” 日本音響学会2009年春季研究発表会, 2009.
  28. 石塚健太郎, 荒木章子, 大塚和弘, 中谷智広, 藤本雅清, “音響情報と映像情報から得られる位置情報の統合による話者ダイアライゼーション,” 日本音響学会講演論文集, 3-5-6, 春季, pp.111-112, 2009.
  29. 渡辺 秀行, 片桐 滋, 山田 幸太, マクダーモット エリック, 中村 篤, 渡部 晋治, 大崎 美穂, “ 大幾何マージン最小分類誤り学習法,” 第12回情報論的学習理論IBIS2009, P043.
  30. 藤本雅清, 石塚健太郎, 中谷智広, ] “確率モデルに基づく音声区間検出法における音声ゲイン補正の検討,” 日本音響学会講演論文集, 1-5-2, 春季, pp.3-6, 2009.
  31. 木下慶介, 中谷智広, 三好正人, “残響除去原理に基づき作成したステレオ音楽サラウンド再生音の主観評価,” 日本音響学会秋季研究発表会, pp.759-760, 2009
  32. J. Muramatsu, and S. Miyake, “Hash property and fixed-rate universal coding theorems,” 第32回情報理論とその応用シンポジム予稿集, pp. 388-393, 2009.
  33. J. Muramatsu, K. Yoshimura, and P. Davis, “Information theoretic security based on bounded observability,” 第7回シャノン理論ワークショップ予稿集, pp. 1-6, 2009.
english   japanese