信号処理研究グループ
コンテンツ
トップページ
研究トピックス
メンバーリスト
発表文献
組織
NTTコミュニケーション科学基礎研究所
メディア情報研究部
メディア認識研究グループ
Signal Processing Research Group
コミュニケーション環境研究
協創情報研究部
人間情報研究部
守谷特別研究室
リンク
先端技術総合研究所
NTT

| 2011 | 2010 | 2009 | 2008 | 2007 | 2006 | 2005 | 2004 | 2003 | 2002 | 2001 | 2000 |

発表文献

2008

論文

  1. J. Muramatsu, “Effect of random permutation of symbols in a sequence,” IEEE Transactions on Information Theory, vol.IT-54, no.1, pp.78-86, January. 2008.
  2. J. Muramatsu, K. Yoshimura, K. Arai, and P. Davis, “Some results on secret key agreement using correlated sources,” NTT Technical Review, vol.6, No.2, February. 2008.
  3. M. Fujimoto and K. Ishizuka, “Noise Robust Voice Activity Detection Based on Switching Kalman Filter,” IEICE Transactions on Information and Systems, Vol. E91-D, No. 3, pp. 467-477, March. 2008.
  4. S. Miyake, and J. Muramatsu, “A construction of lossy source code using LDPC matrices, IEICE Transactions on Fundamentals,” vol.E91-A, no.6, pp.1488-1501, June 2008.
  5. T. Oba, T. Hori, and A. Nakamura, “Sequential Dependency Analysis for Online Spontaneous Speech Processing,” Speech Communication, Volume 50, Issue 7, pp. 616-625, July 2008.
  6. T. Nakatani, B.-H. Juang, T. Yoshioka, K. Kinoshita, M. Delcroix, and M. Miyoshi, “Speech dereverberation based on maximum likelihood estimation with time-varying Gaussian source model,” IEEE Transactions on Audio, Speech and Language Processing, vol. 16, no. 8, pp. 1512-1527, November 2008.
  7. K. Yoshimura, J. Muramatsu, and P. Davis, “Conditions for common-noise-induced synchronization in time-delay systems,” Physica D, vol. 237, no. 23, pp.3146-3152, December. 2008.
  8. H. K. Solvang, K. Ishizuka, and M. Fujimoto, “Voice activity detection based on adjustable linear prediction and GARCH models,” Speech Communication, Vol.50, No.6, pp.476-486, 2008.
  9. T. Nakatani, S. Amano, T. Irino, K. Ishizuka, and T. Kondo, “A method for fundamental frequency estimation and voicing decision: Application to infant utterances recorded in real acoustical environments,” Speech Communication, Vol.50, No.3, pp.203-214, 2008.
  10. 大和田功, 山本徹, 葉海鵬, 内田淳史, 吉森茂, 吉村和之, 村松純, 後藤振一郎, Peter Davis, “半導体レーザを用いた共通信号入力におけるカオス同期の数値解析,” 電気学会論文誌C, vol.128, no.5, pp.768-774, 2008.

書籍, 解説記事

  1. 堀 貴明, 須藤 克仁, 塚田 元, 中村 篤, “世界中の音映像コンテンツを日本語で視聴する技術,” ITUジャーナル 2008年8月号.
  2. S. Makino, S. Araki, and H. Sawada, “Underdetermined Blind Source Separation using Acoustic Arrays,” in Handbook on Array Processing and Sensor Networks, S. Haykin and K.J. Ray Liu, Eds, Wiley, 2008.
  3. 村松 純, “チューリヒ工科大学滞在記,” SITA ニューズレター, 2008.
  4. 白木善尚編, 村松 純, 岩田賢一, 有村光晴, 渋谷智治 共著, “ IT Text シリーズ 情報理論,” オーム社, 2008.

国際会議予稿

  1. T. Yoshioka, T. Nakatani, T. Hikichi, and M. Miyoshi, “Maximum likelihood approach to speech enhancement for noisy reverberant signals,” in Proceedings of the 2008 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2008), pp. 4585-4588, March 2008.
  2. T. Yoshioka and M. Miyoshi, “Adaptive suppression of non-stationary noise by using variational Bayesian method,” in Proceedings of the 2008 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2008), pp. 4889-4892, March 2008.
  3. T. Nakatani, T. Yoshioka, K. Kinoshita, M. Miyoshi, and B.-H., Juang, “Blind speech dereverberation with multi-channel linear prediction based on short time Fourier transform representation,” in Proceedings of the 2008 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2008), pp. 85-88, March 2008.
  4. M. Fujimoto and K. Ishizuka, and T. Nakatani, “A Voice Activity Detection Based on the Adaptive Integration of Multiple Speech Features and a Signal Decision Scheme,” Proc. ICASSP '08, pp. 4441-4444, March. 2008.
  5. A. Ogawa and S. Takahashi, “Weighted distance measures for efficient reduction of Gaussian mixture components in HMM-based acoustic model,” Proc. ICASSP, pp. 4173-4176, March 2008.
  6. T. Oba, T. Hori, and A. Nakamura, “Efficient Discriminative Training of Error Corrective Models Using High-WER Competitors,” Asian Workshop on Speech Science and Technology, IEICE Technical Report SP2007-185-214, pp. 99-104, March 2008.
  7. T. Nakatani, T. Yoshioka, K. Kinoshita, M. Miyoshi, and B.-H., Juang, “Speech dereverberation in short time Fourier transform domain with cross band effect compensation,” in Proceedings of the 2008 Joint Workshop on Hands-free Speech Communication and Microphone Arrays (HSCMA 2008), pp. 220-223, May 2008.
  8. T. Yoshioka, T. Nakatani, and M. Miyoshi, “An integrated method for blind separation and dereverberation of convolutive audio mixtures,” in Proceedings of the 16th European Signal Processing Conference (EUSIPCO 2008), CD-ROM Proceedings, August 2008.
  9. T. Yoshioka, T. Nakatani, and M. Miyoshi, “Enhancement of noisy reverberant speech by linear filtering followed by nonlinear noise suppression,” in Proceedings of the 2008 International Workshop on Acoustic Echo and Noise Control (IWAENC 2008), CD-ROM Proceedings, September 2008.
  10. T. Nakatani, T. Yoshioka, K. Kinoshita, M. Miyoshi, and B.-H. Juang, “Incremental estimation of reverberation with uncertainty using prior knowledge of room acoustics for speech dereverberation,” in Proceedings of the 2008 International Workshop on Acoustic Echo and Noise Control (IWAENC 2008), CD-ROM Proceedings, September 2008.
  11. M. Fujimoto, K. Ishizuka, and T. Nakatani, “Study of Integration of Statistical Model-Based Voice Activity Detection and Noise Suppression,” Proc. Interspeech '08, September 2008.
  12. M. Miyoshi, K. Kinoshita, T. Nakatani, and T. Yoshioka, “Principles and applications of dereverberation for noisy and reverberant audio signals,” in Proceedings of the 2008 Asilomar Conference on Signals, Systems, and Computers, CD-ROM Proceedings, October 2008.
  13. S. Miyake, and J. Muramatsu, “A construction of channel code, joint source-channel code, and universal code for arbitrary stationary memoryless channels using sparse matrices,” Proceedings of the 2008 IEEE International Symposium on Information Theory, Toronto, Canada, pp.1193-1197, 2008.
  14. D. Kolossa (TU Berlin), S. Araki , M. Delcroix, T. Nakatani, R. Orglmeister (TU Berlin), S. Makino, “Missing Feature Speech Recognition in a Meeting Situation with Maximum SNR Beamforming,” ISCAS2008, pp. 3218 -3221, 2008.
  15. J. Muramatsu, and S. Miyake, “Hash property and multi-terminal source coding theorems for sparse matrices and maximal-likelihood coding,” Proceedings of the 2008 IEEE International Symposium on Information Theory, Toronto, Canada, pp.424-428, 2008.
  16. J. Muramatsu, and S. Miyake, “Lossy source coding algorithm using lossless multi-terminal source codes,” Proceedings of the 2008 International Symposium on Information Theory and its Applications, Auckland, New Zealand, pp.606-611, 2008.
  17. K. Ishizuka, S. Araki, and T. Kawahara, “Statistical speech activity detection based on spatial power distribution for analyses of poster presentations,” Proceedings of the 10th International Conference on Spoken Language Processing (Interspeech2008 - ICSLP), pp.99-102, 2008.
  18. K. Ishizuka, S. Araki, T. Kawahara, “Statistical Speech Activity Detection based on Spatial Power Distribution for Analyses of Poster Presentations,” Interspeech2008, pp.99-102, 2008.
  19. K. Otsuka, S. Araki, K. Ishizuka, M. Fujimoto, M. Heinrich, J. Yamato, “A Realtime Multimodal System for Analyzing Group Meetings by Combining Face Pose Tracking and Speaker Diarization,” ICMI2008, pp. 257-264, 2008.
  20. K. Otsuka, S. Araki, K. Ishizuka, M. Fujimoto, M. Hinrich, and J. Yamato, “A realtime multimodal system for analyzing group meetings by combining face pose tracking and speaker diarization,” Proceedings of the 10th International Conference on Multimodal Interfaces (ICMI2008), pp. 257-264, 2008.
  21. M. Delcroix, T. Nakatani, and S. Watanabe, “Combined static and dynamic variance adaptation for efficient interconnection of speech enhancement pre-processor with speech recognizer,” Proc. ICASSP 2008 pp. 4073-4076, 2008.
  22. M. Fujimoto, K. Ishizuka, and T. Nakatani, “A voice activity detection based on the adaptive integration of multiple speech features and a signal decision scheme,” Proceedings of the 33rd International Conference on Acoustics, Speech and Signal Processing (ICASSP2008), pp.4441-4444, 2008.
  23. M. Fujimoto, K. Ishizuka, and T. Nakatani, “Study of integration of statistical model-based voice activity detection and noise suppression,” Proceedings of the 10th International Conference on Spoken Language Processing (Interspeech2008 - ICSLP), pp.2008-2011, 2008.
  24. S. Araki, M. Fujimoto, K. Ishizuka, H. Sawada, and S. Makino, “A DOA based speaker diarization system for real meetings,” Proceedings of the Joint Workshop on Hands-Free Speech Communication and Microphone Arrays (HSCMA2008), pp.29-32, 2008.
  25. S. Araki, M. Fujimoto, K. Ishizuka, H. Sawada, and S. Makino, “Speaker indexing and speech enhancement in real meetings / conversations,” Proceedings of the 33rd International Conference on Acoustics, Speech and Signal Processing (ICASSP2008), pp.93-96, 2008.
  26. S. Watanabe and A. Nakamura, “A unified interpretation of adaptation techniques based on a macroscopic time evolution system with indirect/direct approaches,” Proc. ICASSP 2008 pp. 4285-4286, 2008.
  27. T. Hager, S. Araki, K. Ishizuka, M. Fujimoto, T. Nakatani, and S. Makino, “Handling speaker position changes in a meeting diarization system by combining DOA clustering and speaker identification,” Proceedings of the 11th International Workshop on Acoustic Echo and Noise Control (IWAENC2008), 2008.
  28. T. Hager, S. Araki, K. Ishizuka, M. Fujimoto, T. Nakatani, S. Makino, “Handling speaker position changes in a meeting diarization system by combining DOA clustering and speaker identification,” IWAENC2008 CD-ROM proceedings, 2008.
  29. T. Kawahara, H. Setoguchi, K. Takanashi, K. Ishizuka, and S. Araki, “Multi-modal recording, analysis and indexing of poster sessions,” Proceedings of the 10th International Conference on Spoken Language Processing (Interspeech2008 - ICSLP), pp.1622-1625, 2008.

その他会議予稿

  1. 堀 貴明, 須藤 克仁, 大庭 隆伸, 渡部 晋治, 渡辺 太郎, 塚田 元, 中村 篤, “「世界メディアブラウザ」− 音声認識と統計翻訳に基づく多言語動画コンテンツ 検索/閲覧システム,” 第2回音声ドキュメント処理ワークショップ, pp. 59-64, February 2008.
  2. 吉岡 拓也, 中谷 智広, 三好 正人, “雑音と残響の同時抑圧による音声強調,” 日本音響学会 2008年春季研究発表会講演論文集, 3-6-10, pp. 731-732, March 2008.
  3. 中谷 智広, 吉岡 拓也, 木下 慶介, 三好 正人, ジュアング ビン・ファン, “短時間フーリエ変換表現を用いた最尤推定に基づく音声信号の残響除去,” 日本音響学会 2008年春季研究発表会 講演論文集, 3-6-11, pp. 733-734, March 2008.
  4. 藤本 雅清, 石塚 健太郎, 中谷 智広, “確率モデルに基づく音声区間検出と雑音抑圧の統合の検討,” 日本音響学会, 平成20年度春季研究発表会, 1-10-9, pp. 27-30, March 2008.
  5. 荒木, 藤本, 石塚, 澤田, 牧野, “音声区間検出と方向情報を用いた会議音声話者識別システムとその評価,” 日本音響学会2008年春季研究発表会, March 2008.
  6. 荒木, 澤田, 牧野, “音声のスパース性を用いたUnderdetermined音源分離,” 電子情報通信学会2008年総合大会, March 2008.
  7. 荒木, 伊藤(東大), 澤田, 小野(東大), 牧野, 嵯峨山(東大), “周波数領域ICAにおける初期値の短時間データからの学習,” 電子情報通信学会2008年総合大会, March 2008.
  8. 大庭 隆伸, 堀 貴明, 中村 篤, “単語誤り率を考慮した誤り訂正モデル学習とその効果に関する分析,” 日本音響学会講演論文集, pp.128-129, March 2008.
  9. 小川厚徳,高橋敏, “状態尤度近似とバッチ状態尤度計算の組み合わせによる音響尤度計算の高速化,” 音講論集,2-10-10, March 2008.
  10. 小橋川哲,小川厚徳,政瀧浩和,高橋敏, “キーワードに関する十分統計量増強による精度向上の検討,” 音講論集,1-Q-23, March 2008.
  11. 西亀 健太, 渡部晋治, 西本 卓也, 小野 順貴, 嵯峨山 茂樹, “複数残響特性下の音声を単一モデル学習に用いた未知残響環境に頑健な音声認識,” 2008-SP-8, pp. 43-48 May 2008.
  12. 藤本 雅清, 石塚 健太郎, 中谷 智広, “確率モデルに基づく音声区間検出と雑音抑圧の統合法の評価と考察,” 電子情報通信学会, 音声研究会, SP2008-45, pp. 13-18, July 2008.
  13. 渡部 晋治, 堀 貴明, 中村 篤, “複数音響環境の発話単位遷移モデルに基づく適応学習法の検討,” 電子情報通信学会研究報告2008-SP-54, pp. 67-72, July 2008.
  14. 【招待講演】大庭隆伸, “識別的言語モデルの可能性,” 電子情報通信学会研究技術報告, 2008-SLP-72, pp. 47-50, July 2008.
  15. 吉岡 拓也, 中谷 智広, 三好 正人, “雑音・残響抑圧を目的とした線形フィルタに非線形フィルタを後置させた系の最適化法,” 日本音響学会 2008年秋季研究発表会講演論文集, 3-P-35, pp. 845-846, September 2008.
  16. 吉岡 拓也, 中谷 智広, 三好 正人, “ブラインド音源分離と残響除去の統合のための一手法,” 日本音響学会 2008年秋季研究発表会講演論文集, 3-8-9, pp. 703-704, September 2008.
  17. 亀岡 弘和, 中谷 智広, 吉岡 拓也, “音声のスパース性と非負制約つき畳み込みモデルに基づくパワースペクトル領域残響除去,” 日本音響学会 2008年秋季研究発表会講演論文集, 3-8-10, pp. 705-708, September 2008.
  18. 中谷 智広, 吉岡 拓也, 木下 慶介, 三好 正人, ジュアング ビン・ファン, “室内伝達特性の確率モデルを用いて推定された残響信号の事後分布に基づく逐次的な残響除去,” 日本音響学会 2008年秋季研究発表会講演論文集, 1-P-17, pp. 753-756, September 2008.
  19. 藤本 雅清, 石塚 健太郎, 中谷 智広, “確率モデルに基づく統合的フロントエンド処理の検討,” 日本音響学会, 平成20年度秋季研究発表会, 1-1-5, pp. 11-14, September 2008.
  20. 西亀 健太, 和泉 洋介, 小野 順貴, 西本 卓也, 嵯峨山 茂樹, 渡部 晋治, “音声スパース性に基づく2ch BSS を用いた雑音・残響下での音声認識,” 音響学会講演論文集, 1-1-4, September 2008.
  21. 堀 貴明, 須藤 克仁, 大庭 隆伸, 渡部 晋治, 小川 厚徳, 渡辺 太郎, マクダーモット エリック, 塚田 元, 中村 篤, “「世界メディアブラウザ」 −音声認識と統計翻訳に基づく多言語動画コンテンツ検索/閲覧システム−,” 音響学会講演論文集, 1-1-17, September 2008.
  22. 渡部 晋治, 中村 篤, “巨視的な時間発展系に基づく逐次追従型音声認識,” 音響学会講演論文集, 2-P-9, September 2008.
  23. D. Cournapeau, T. Kawahara, S. Watanabe, and A. Nakamura, “An Application of Online VB-EM Algorithm to Voice Activity Detection,” 音響学会講演論文集, 3-Q-11, September 2008.
  24. 藤本 雅清, 石塚 健太郎, 中谷 智広, “音声区間検出と雑音抑圧の統合法を用いた雑音下音声認識,” 電子情報通信学会, 音声研究会, SP2008-81, pp. 13-18, December. 2008.
  25. 西亀 健太, 和泉 洋介, 渡部 晋治, 西本 卓也, 小野 順貴, 嵯峨山 茂樹, “スパース性に基づくブラインド音源分離を用いた2チャンネル入力音声認識,” 信学技報, vol. 108, no. 338, SP2008-79, pp. 1-6, December 2008.
  26. 佐古 淳, 有木 康雄, 岩田 具治, 渡部 晋治, 堀 貴明, “話題の連続/不連続変化を考慮したトピックモデルに基づく音声認識,” 信学技報, vol. 108, no. 338, SP2008-88, pp. 55-60, December 2008.
  27. 堀 貴明, “10周年企画「音声言語研究関連分野の10年の歩み」 〜 フロントエンド特徴抽出音響モデル,” 第10回 音声言語シンポジウム, December 2008.
  28. K. Kinoshita, T. Nakatani, M. Miyoshi and T. Kubota, “A new audio post-production tool for speech dereverberation,” Audio Engineering Society (AES) 125th Convention, San Francisco, 2008
  29. 岩田具治, 渡部晋治, 山田武士, 上田修功, “トピックモデルに基づくユーザ興味の追跡,” 第11回情報論的学習理論IBIS2008, A18.
  30. 荒木, 藤本, 石塚, 中谷, 澤田, 牧野, “音声区間推定と時間周波数領域方向推定の統合による会議音声話者識別,” 電子情報通信学会技術研究報告, Vol.EA2008-40, pp 19-24, 2008.
  31. 荒木章子, 藤本雅清, 石塚健太郎, 中谷智広, 澤田宏, 牧野昭二, “音声区間推定と時間周波数領域方向推定の統合による会議音声話者識別,” 電子情報通信学会技術研究報告, EA2008-40, pp.19-24, 2008.
  32. 荒木章子, 藤本雅清, 石塚健太郎, 澤田宏, 牧野昭二, “音声区間検出と方向情報を用いた会議音声話者識別システムとその評価,” 日本音響学会講演論文集, 1-10-1, 春季, pp.1-4, 2008.
  33. 石塚健太郎, 荒木章子, 大塚和弘, 中谷智広, 藤本雅清, “音響情報と映像情報の統合による多人数会話における話者決定技術,” 情報処理学会研究報告, 2008-SLP-74, pp.25-30, 2008.
  34. 大塚, 荒木, 石塚, 藤本, 大和, “多人数会話シーン分析に向けた実時間マルチモーダルシステムの構築 〜マルチモーダル全方位センサを用いた顔方向追跡と話者ダイアリゼーションの統合,” 電子情報通信学会マルチメディア・仮想環境基礎研究会 (MVE), 信学技報, vol. 108, no. 328, MVE2008-68, pp. 55-62, 2008.
  35. 渡部 晋治, 中村 篤, “巨視的な時間発展系に基づく逐次追従型音声認識,” 第11回情報論的学習理論IBIS2008, A22.
  36. 藤本雅清, 石塚健太郎, 中谷智広, “音声区間検出と雑音抑圧の統合法を用いた雑音下音声認識,” 情報処理学会研究報告, 2008-SLP-74, pp.13-18, 2008.
  37. 藤本雅清, 石塚健太郎, 中谷智広, “確率モデルに基づく音声区間検出と雑音抑圧の統合の検討,” 日本音響学会講演論文集, 1-10-9, 春季, pp.27-30, 2008.
  38. 藤本雅清, 石塚健太郎, 中谷智広, “確率モデルに基づく統合的フロントエンド処理の検討,” 日本音響学会講演論文集, 1-1-5, 秋季, pp.11-14, 2008.
  39. 木下慶介, 中谷智広, 三好正人, “Upmixing stereo music signals based on dereverberation mechanism,” Audio Engineering Society (AES) Japan conference 2008
  40. 木下慶介, 中谷智広, 三好正人, “残響除去原理に基づくステレオ音楽信号のサラウンド化,” 日本音響学会秋季研究発表会, pp.615-618, 2008
  41. J. Muramatsu, and S. Miyake, “Construction of wiretap channel codes by using sparse matrices,” 第6回シャノン理論ワークショップ予稿集, pp. 39-44, 2008.
  42. 村松純, 三宅茂樹, “疎行列アンサンブルのハッシュ性と多端子情報源符号(招待論文),” 科研費特定領域研究「情報統計力学の深化と展開」チュートリアル, ネットワーク情報理論:「センシングと符号化」予稿集, pp. 10-20, 2008.
  43. J. Muramatsu, and S. Miyake, “Coding theorems based on the hash property,” 第31回情報理論とその応用シンポジム予稿集, pp. 83-88, 2008.
  44. J. Muramatsu, and S. Miyake, “Basic lemmas of a hash property,” 第31回情報理論とその応用シンポジム予稿集, pp. 77-82, 2008.
  45. 村松純, 三宅茂樹, “疎行列の符号化問題への応用(招待論文),” 電子情報通信学会研究報告, vol. IT2008-24, pp. 25-30, 2008.
  46. S. Miyake and J. Muramatsu, “A construction of channel code, joint source-channel code, and universal code for arbitrary stationary memoryless channels using sparse matrices,” 電子情報通信学会研究報告, vol. IT2007-54, pp. 37-42, 2008.
  47. 村松純, “相関乱数からの秘密鍵共有法について(招待論文),” 電子情報通信学会研究報告, vol. IT2007-32, pp. 39-44, 2008.
english   japanese