研究内容
興味のあるところ
(残響下での)音声信号分離、抽出、話者セグメンテーション(diarization)、聴覚情景解析
論文、レター
- S. Araki, R. Mukai, S. Makino, T. Nishikawa(NAIST) and H. Saruwatari(NAIST),
``The Fundamental Limitation of Frequency Domain Blind Source Separation for Convolutive Mixtures of Speech,'' IEEE Trans. Speech Audio Processing, Vol. 11, No. 2, pp. 109-116, 2003. [pdf]
- S. Araki, S. Makino, Y. Hinamoto, R. Mukai, T. Nishikawa(NAIST) and H. Saruwatari(NAIST),
``Equivalence between Frequency Domain Blind Source Separation and Frequency Domain Adaptive Beamforming for Convolutive Mixtures'', EURASIP Journal on Applied Signal Processing, vol. 2003, no. 11, pp. 1157--1166, 2003.[pdf]
- S. Araki, S. Makino, R. Aichner(Univ. Erlangen-Nuremberg), T. Nishikawa(NAIST) and H. Saruwatari(NAIST), ``Subband-based Blind Separation for Convolutive Mixtures of Speech,'' IEICE Trans. Fundamentals, E88-A(12), pp. 3593--3603, 2005. [pdf]
- S. Araki, H. Sawada, R. Mukai and S. Makino, ``Underdetermined Blind Sparse Source Separation for Arbitrarily Arranged Multiple Sensors,'' Signal Processing, doi:10.1016/j.sigpro.2007.02.003, 2007 (available online at http://www.sciencedirect.com and http://dx.doi.org/10.1016/j.sigpro.2007.02.003).
- S. Araki, H. Sawada, R. Mukai and S. Makino, "DOA Estimation for Multiple Sparse Sources with Arbitrarily Arranged Multiple Sensors," Journal of Signal Processing Systems, doi:10.1007/s11265-009-0413-9, 2009 (available online at http://www.springerlink.com/content/8w54h51v31086776/)
- S. Araki, T. Nakatani, and H. Sawada, "Sparse source separation based on simultaneous clustering of source locational and spectral features", Acoustical Science and Technology, Acoustic Letter, vol. 32, no. 4, July, 2011.
- H. Sawada, S. Araki and S. Makino, "Underdetermined Convolutive Blind Source Separation via Frequency Bin-wise Clustering and Permutation Alignment," IEEE Trans. Audio, Speech, and Language Processing, vol.19, no.3, pp.516-527, March 2011.
- T. Hori, S. Araki, T. Yoshioka, M. Fujimoto, S. Watanabe, T. Oba, A. Ogawa, K. Otsuka, D. Mikami, K. Kinoshita, T. Nakatani, A. Nakamura, and J. Yamato, "Low-latency Real-time Meeting Recognition and Understanding Using Distant Microphones and Omni-directional Camera," IEEE Trans. ASLP, Vol. 20, No. 2, pp. 499-513, 2012.
- M. Souden, S. Araki, K. Kinoshita, T. Nakatani and H. Sawada, "A Multichannel MMSE-Based Framework for Speech Sources Separation and Noise Reduction," IEEE Trans. Audio, Speech and Language Processing, no.9, vol.11, pp. 1913-1928, 2013.
- 丸山卓郎, 荒木章子, 中谷智広, 宮部滋樹, 山田武志, 牧野昭二, 中村篤, "周波数依存到来時間差推定に基づく劣決定ブラインド音源分離の高速化,"日本音響学会論文誌, 2014
- T. Higuchi, N. Ito, S. Araki, T. Yoshioka, M. Delcroix, and T. Nakatani, "Online MVDR Beamformer Based on Complex Gaussian Mixture Model with Spatial Prior for Noise Robust ASR," IEEE Trans on TASLP, 2017.
- N. Ito, S. Araki, and T. Nakatani, "FASTFCA: A JOINT DIAGONALIZATION BASED FAST ALGORITHM FOR AUDIO SOURCE SEPARATION USING A FULL-RANK SPATIAL COVARIANCE MODEL," Arxiv, 2018.
Book Chapter
- S. Araki, S. Makino, Subband Based Blind Source Separation, In J. Benesty, S. Makino, and J. Chen, editors, Speech Enhancement, pp. 329--352, Springer, March 2005.
- H. Sawada, R. Mukai, S. Araki and S. Makino, Frequency-domain blind source separation, In J. Benesty, S. Makino, and J. Chen, editors, Speech Enhancement, pp.299--327, Springer, March 2005.
- R. Mukai, H. Sawada, S. Araki and S. Makino, Real-time blind source separation for moving speech signals, In J. Benesty, S. Makino, and J. Chen, editors, Speech Enhancement, pp.353--369, Springer, March 2005.
- S. Makino, H. Sawada, R. Mukai, and S. Araki, ''Blind source separation of convolutive mixtures of audio signals in frequency domain, '' in Topics in Acoustic Echo and Noise Control, E. Haensler and G. Schmidt, Eds., Springer, 2006.
- S. Araki, H. Sawada and S. Makino, ''K-means based Underdetermined Blind Speech Separation,'' in Blind Speech Separation, S. Makino T.-W. Lee and H. Sawada, Eds., Springer, 2007.
- H. Sawada, S. Araki, and S. Makino, ''Frequency-Domain Blind Source Separation,'' in Blind Speech Separation, S. Makino T.-W. Lee and H. Sawada, Eds., Springer, 2007.
- S. Makino, S. Araki, S. Winter, H. Sawada, "Underdetermined Blind Source Separation using Acoustic Arrays," Handbook on Array Processing and Sensor Networks, S. Haykin, and K. J. R. Liu Eds., Wiley, 2009.
- N. Ito, S. Araki, and T. Nakatani, "Multi-channel audio source separation by modelling audio directional statistics," in Audio Source Separation, S. Makino Ed., Springer, 2017.
- M. I. Mandel, S. Araki, and T.Nakatani, "Multichannel classification and clustering approaches," in Audio Source Separation and Speech Enhancement, E.Vincent, T.Virtanen, and S.Gannot, Eds., John Wiley & Sons, Oct., 2018 (coming soon).
国際会議
[2001-2005]
- S. Araki, S. Makino, T. Nishikawa, and H. Saruwatari,
``Fundamental Limitation of Frequency Domain Blind Source Separation for Convolutive Mixture of Speech,'' IEEE International Conference on Acoustics, Speech, and Signal (ICASSP2001), pp. 2737--2740, May, 2001.
- S. Araki, S. Makino, R. Mukai, and H. Saruwatari,
``Equivalence between Frequency Domain Blind Source Separation and Frequency Domain Adaptive Null Beamformers,'' 7th European Conference on Speech Communication and Technology (Eurospeech2001), vol.4, pp. 2595-2598, Sept., 2001.
- R. Aichner, S. Araki, S. Makino, T. Nishikawa(NAIST), and H. Saruwatari(NAIST),
``Time domain Blind Source Separation of non-stationary convolved signals by utilizing geometric beamforming,'' NNSP2002, pp. 445-454, 2002. [pdf]
- S. Araki, S. Makino, R. Aichner, T. Nishikawa(NAIST), and H. Saruwatari(NAIST),
``Subband Based Blind Source Separation for Convolutive Mixtures of Speech,'' ICASSP2003, Vol. V, pp. 509--512, 2003.
- M. Knaak (Technical University Berlin), S. Araki, S. Makino,``
Geometrically Constraint ICA for a Convolutive Mixtures of Sound,''
ICASSP2003, Vol. II, pp. 725--728, 2003.
- S. Araki, S. Makino, A. Blin, R. Mukai and H. Sawada, ``Blind Separation of More Speech than Sensors with Less Distortion by Combining Sparseness and ICA,'' IWAENC2003, pp.271--274, 2003. -->sound demos. [pdf]
- S. Araki, S. Makino, H. Sawada and R. Mukai, ``Reducing musical noise by a fine-shift overlap-add method applied to source separation using a time-frequency mask,'' ICASSP2005, vol. III, pp. 81-84, March 2005. [pdf], -->sound demos.
- S. Araki, H. Sawada, R. Mukai and S. Makino,``A novel blind source separation method with observation vector clustering,'' , IWAENC2005, pp.117--120, 2005. [pdf], -->sound demos.
[2006-2010]
- S. Araki, H. Sawada, R. Mukai and S. Makino,``DOA estimation for multiple sparse sources with normalized observation vector clustering,'', ICASSP2006, Vol. 5, pp.33--36, 2006. [pdf]
- S. Araki, H. Sawada, R. Mukai and S. Makino, "Performance evaluation of sparse source separation and DOA estimation with observation vector clustering in reverberant environments," IWAENC2006, 2006. [pdf]
- J. Cermak, S. Araki, H. Sawada and S. Makino, "Blind Speech Separation by Combining Beamformers and a Time Frequency Binary Mask," IWAENC2006, 2006. [pdf]
- S. Araki, H. Sawada and S. Makino, "Blind Speech Separation in a Meeting Situation," ICASSP2007, vol. I, pp. 41--45, 2007. [pdf], [demo](Please use IE for the demo.)
- S. Araki, M. Fujimoto, K. Ishizuka, H. Sawada, and S. Makino, "Speaker indexing and speech ehnancement in real meetings / conversations," ICASSP2008, pp.93--96, 2008. [pdf]
- S. Araki, M. Fujimoto, K. Ishizuka, H. Sawada, and S. Makino, "A DOA based speaker diarization system for real meetings," HSCMA2008, pp.29--32, 2008 (invited).[pdf]
- S. Araki, T. Nakatani, H. Sawada, and S. Makino, "Blind sparse source separation for unknown number of sources using Gaussian mixture model fitting with Dirichlet prior," ICASSP2009, pp.33-36, 2009. [pdf]
- S. Araki, T. Nakatani, H. Sawada, and S. Makino, "Stereo source separation and source counting with MAP estimation with Dirichlet prior considering spatial aliasing problem," ICA2009, pp. 742--750, 2009. [pdf]
- K. Ishiguro, T. Yamada, S. Araki and T. Nakatani, "A Probabilistic Speaker Clustering for DOA-based Diarization,"
IEEE Workshop on Applications of Signal Processing to Audio and Acoustics (WASPAA 2009), pp. 241-244, 2009. [pdf]
- K. Ishizuka, S. Araki, K. Otsuka, T. Nakatani, and M. Fujimoto, "A speaker diarization method based on the probabilistic fusion of audio-visual location information," Proceedings of the 11th International Conference on Multimodal Interfaces and Workshop on Machine Learning for Multi-modal Interaction (ICMI-MLMI2009), pp.55-62, 2009.
- K. Otsuka, S. Araki, D. Mikami, K. Ishizuka, M. Fujimoto, and J. Yamato: "Realtime Meeting Analysis and 3D Meeting Viewer Based on Omnidirectional Multimodal Sensors", Proc. ICMI-MLMI2009, 2009.
- T. Tashiro, S. Araki, Y. Nakanishi, H. Kimura, K. Kumozaki and M. Miyoshi, "Optical Access System with Emergency Voice Communication Using Blind Speech Separation for Demultiplexing Randomly Mixed Signals," GLOBECOM, 2009.
- S. Araki, T. Nakatani and H. Sawada, "Simultaneous clustering of mixing and spectral model parameters for blind sparse source separation," ICASSP2010, 2010.
- S. Araki, A. Ozerov, V. Gowreesunker, H. Sawada, F. Theis, G. Nolte, D. Lutter, N. Duong, "The 2010 Signal Separation Evaluation Campaign (SiSEC2010): - Audio source separation - ," in Proc of LVA/ICA2010, 2010.
- S. Araki, F. Theis, G. Nolte, D. Lutter, A. Ozerov, V. Gowreesunker, H. Sawada, N. Duong, "The 2010 Signal Separation Evaluation Campaign (SiSEC2010): - Biomedical source separation - ," in Proc of LVA/ICA2010, 2010.
- S. Araki, T. Hori, M. Fujimoto, S. Watanabe, T. Yoshioka, T. Nakatani, "Online meeting recognizer with multichannel speaker diarization", Asilomar 2010. (invited)
[2011-2015]
- S. Araki and T. Nakatani, "Hybrid Approach for Multichannel Source Separation Combining Time-frequency Mask with Multi-channel Wiener Filter," ICASSP2011, 2011.
- S. Araki, T. Hori, T. Yoshioka, M. Fujimoto, S. Watanabe, T. Oba, A. Ogawa, K. Otsuka, D. Mikami, M. Delcroix, K. Kinoshita, T. Nakatani, A. Nakamura, and J. Yamato, "Demonstration on low-latency meeting recognition and understanding using distant microphones," HSCMA2011, 2011.
- K. Iso, S. Araki, S. Makino, T. Nakatani, H. Sawada, T. Yamada, and A. Nakamura, "BLIND SOURCE SEPARATION OF MIXED SPEECH IN A HIGH REBERBERATION ENVIRONMENT," HSCMA2011, 2011.
- T. Maruyama, Shoko Araki, T. Nakatani, S. Miyabe, T. Yamada, S. Makino and A. Nakamura, "NEW ANALYTICAL UPDATE RULE FOR TDOA INFERENCE FOR UNDERDETERMINED BSS IN NOISY ENVIRONMENTS," ICASSP2012.
- S. Araki and T. Nakatani,"Sparse vector factorization for underdetermined BSS using wrapped-phase GMM and source log-spectral prior," ICASSP2012, 2012.
- S. Araki, F. Nesta, E. Vincent, Z. Koldovsky, G. Nolte, A. Ziehe, and A. Benichoux, "SiSEC2011 Overview: Audio source separation," in Proc. LVA/ICA2012, pp. 414--422, Mar. 2012.
- S. Araki and T. Hayashi, M. Delcroix, M. Fujimoto, K. Takeda and T. Nakatani,"Exploring multi-channel features for denoising-autoencoder-based speech enhancement," ICASSP2015, 2015.
- N. Ito, S. Araki, and T. Nakatani, “Permutation-free Clustering of Relative Transfer Function Features for Blind Source Separation,” Proc. EUSIPCO 2015 (to appear).
-
[2016-]
- H. Meutzner, S. Araki, M. Fujimoto and T. Nakatani, "A Generative-Discriminative Hybrid Approach to Multi-Channel Noise Reduction for Robust Automatic Speech Recognition," ICASSP2016, 2016.
- S. Araki, M. Okada, T. Higuchi, A. Ogawa and T. Nakatani, "SPATIAL CORRELATION MODEL BASED OBSERVATION VECTOR CLUSTERING AND MVDR BEAMFORMING FOR MEETING RECOGNITION," ICASSP2016, 2016.
- S. Araki, N. Ito, D. Marc, A. Ogawa, K. Kinoshita, T. Higuchi, T. Yoshioka, D. Tran, S. Karita, and T. Nakatani, "Online Meeting Recognition in Noisy Environments with Time-Frequency Mask Based MVDR Beamforming," Proc. HSCMA, Mar. 2017.
- K. Yamamoto, T. Irino, T. Matsui, S. Araki, K. Kinoshita and T. Nakatani, "Predicting Speech Intelligibility Using Gammachirp Envelope Distortion Analysis Method Based on the Signal-to-Distortion Ratio", Interspeech2017, 2017.
- S. Araki, N. Ono, K. Kinoshita and M.Delcroix, "MEETING RECOGNITION WITH ASYNCHRONOUS DISTRIBUTED MICROPHONE ARRAY, " ASRU2017, 2017
- S. Araki, N. Ono, K. Kinoshita, and M. Delcroix, "MEETING RECOGNITION WITH ASYNCHRONOUS DISTRIBUTED MICROPHONE ARRAY USING BLOCK-WISE REFINEMENT OF MASK-BASED MVDR BEAMFORMER," ICASSP2018, 2018.
- N. Ito, S. Araki, and T. Nakatani, "FastFCA: Joint Diagonalization Based Acceleration of Audio Source Separation Using a Full-Rank Spatial Covariance Model," Proc. EUSIPCO, Sep. 2018 (to appear).
- S. Araki, N. Ono, K. Kinoshita, and M. Delcroix,"Comparison of reference microphone selection algorithms for distributed microphone array based speech enhancement in meeting recognition scenarios," IWAENC2018, 2018.
- S. Araki, N. Ono, K. Kinoshita, and M. Delcroix, "Estimation of sampling frequency mismatch between distributed asynchronous microphones under existence of source movements with stationary time periods detection," ICASSP2019, 2019
- S. Araki, N. Ono, K. Kinoshita, and M. Delcroix, "PROJECTION BACK ONTO FILTERED OBSERVATIONS FOR SPEECH SEPARATION .WITH DISTRIBUTED MICROPHONE ARRAY," CAMSAP2019, 2019
- K. Arai, S. Araki, A. Ogawa, K. Kinoshita, T. Nakatani, K. Yamamoto, and T. Irino, "Predicting speech intelligibility of enhanced speech using phone accuracy of DNN-based ASR system," Interspeech 2019, 9 2019.
国内研究報告
[2001-2010]
- 荒木章子, 牧野昭二, 西川剛樹, 猿渡洋, "実環境での混合音声に対する周波数領域ブラインド音源分離手法の性能限界," 日本音響学会2001年春季研究発表会 (2001.3)
- 荒木章子, 牧野昭二, 西川剛樹, 猿渡洋, "周波数領域ブラインド音源分離と周波数領域適応ビームフォーマの関係について" 日本音響学会2001年秋季研究発表会 (2001.10)
- 荒木章子, 牧野昭二, Robert Aichner, 西川剛樹(NAIST), 猿渡洋(NAIST), ``サブバンド処理によるブラインド音源分離に関する検討 ,'' 日本音響学会2002年春季研究発表会講演論文集, pp. 619-620, 2002.
- 荒木章子, 牧野昭二, Robert Aichner, 西川剛樹(NAIST), 猿渡洋(NAIST), ``帯域に適した分離手法を用いるサブバンド領域ブラインド音源分離,'' 日本音響学会2003年春季研究発表会, pp. 781--782, 2003.
- 荒木章子, 向井良, 澤田宏, 牧野昭二, ``時間周波数マスキングとICAの併用による音源数 > マイク数の場合のブラインド音源分離,'' 日本音響学会2003年秋季研究発表会, pp.587-588, 2003.
- 荒木章子, Audrey Blin, 牧野昭二, ``Blind Separation of More Speech Signals than Sensors using Time-frequency Masking and Mixing Matrix Estimation,'' 日本音響学会2003年秋季研究発表会, pp.585-586, 2003.
- 荒木, 澤田, 向井, 牧野,``観測信号ベクトル正規化とクラスタリングによる音源分離手法とその評価,'' 日本音響学会2005年秋季研究発表会, pp. 591--592, 2005. [pdf].
- 荒木, 澤田, 向井, 牧野,``観測信号ベクトルのクラスタリングに基づくスパース信号の到来方向推定,'' 日本音響学会2006年春季研究発表会, pp. 615--616, 2006, [pdf].
- 荒木, 澤田, 牧野, ''話者分類とSN比最大化ビームフォーマに基づく会議音声強調,'' 日本音響学会2007年春季研究発表会, pp. 571--572, Mar. 2007. [pdf]
- 荒木, 藤本, 石塚, 澤田, 牧野, "音声区間検出と方向情報を用いた会議音声話者識別システムとその評価," 日本音響学会2008年春季研究発表会, Mar. 2008. [pdf]
- 荒木, 澤田, 牧野, "音声のスパース性を用いたUnderdetermined音源分離," 電子情報通信学会2008年総合大会, Mar. 2008.
- 荒木, 藤本, 石塚, 中谷, 澤田, 牧野, "音声区間推定と時間周波数領域方向推定の統合による会議音声話者識別," 電子情報通信学会技術研究報告, Vol.EA2008-40, pp 19--24, 2008.
- 小笠原(名大),石塚,荒木,藤本,中谷,大塚,"SN 比最大化ビームフォーマを用いたオンライン会議音声強調",日本音響学会2009年春季研究発表会, 2009. [pdf]
- 荒木, 中谷, 澤田, "ディリクレ事前分布を用いた音声のスパース性に基づく音源数推定と音源分離," 日本音響学会2009年秋季研究発表会, 2009. [pdf]
- 堀,荒木,吉岡,大庭,藤本,渡部,小川,大塚,三上,木下,中谷,中村,大和,"いつ誰が何を話したかを即座に認識するオンライン会話分析システム - (1)コンセプトとデザイン- ," 日本音響学会2010年秋季研究発表会,2010.
- 藤本, 荒木, 吉岡,木下,中谷,中村,"いつ誰が何を話したかを即座認識するオンライン会話分析システム -(2) 複数話者遠隔発話音声認識のための音声強調技術-," 日本音響学会2010年秋季研究発表会,2010.
[2011-2015]
- 荒木, 中谷, "時間周波数マスクと多chウィーナフィルタによるハイブリッド音源分離アプローチ," 日本音響学会2011年春季研究発表会,2011.
- 丸山,荒木,中谷,宮部,山田,牧野,中村,"周波数依存の時間差モデルによる劣決定BSS," 信学技報, vol. 111, no. 306, EA2011-86, pp. 25-30, 2011年11月.
- 堀,荒木,小川,ソウデン,デルクロア,吉岡,大庭,藤本,木下,久保,咸,渡部 ,中谷,中村, "会話分析タスクにおける複数人自由会話の遠隔発話音声認識の評価," 日本音響学会2012年春季研究発表会, 3-P-5, 2012.
- 堀、荒木、大塚、中谷、中村、大和, "複数人会話シーン分析の研究と今後の展望",
信学技報, vol. 112, no. 141, SP2012-52, pp. 13-18, 2012年7月. (招待講演)
- 丹羽、日岡、荒木、古家、羽田, "最大SN比法への拡散センシングの適用," 日本音響学会2012年秋季研究発表会, 2012
- 伊藤、J. Ingrid, 荒木、中谷, "音源アクティビティ系列のクラスタリングに基づく高残響・劣決定下音源数推定法," 信学技報, vol. 113, no. 242, EA2013-66, pp. 17-21, 2013年10月.
- 堀、久保、小川、荒木、中村、「会話シーン分析の複数人自由会話音声認識におけるディープラーニングの効果」 音響学会2013年度秋季研究発表会, 2013.
- 荒木、林、デルクロア、藤本、武田、中谷、"マルチチャネル特徴を用いた denoising autoencoder による音声強調, " 日本音響学会講演論文集,March 2015.
[2016-]
- 荒木、岡田、樋口、小川、中谷、“時間周波数マスク推定に基づくMVDRビームフォーミングの会議音声認識への適用,”日本音響学会春季研究発表会 2016.
- 中谷、伊藤、樋口、荒木、吉岡、藤本、木下、“NTT CHiME-3 音声認識システム:耐雑音フロントエンド,”日本音響学会春季研究発表会 2016.
- 荒木, 木下, 伊藤, 小川, デルクロア, 樋口, 吉岡, チャン, 中谷, “雑音のある環境での複数人会話音声認識,”日本音響学会 秋季研究発表会, 2016.【招待講演】
- 山本、入野、松井、荒木、木下、中谷, “音声明瞭度予測法dcGC-sEPSM の諸検討:評価用雑音の特性と予測精度への影響,”日本音響学会 秋季研究発表会, 2016.
- 伊藤、荒木、Fakhri、中谷, “統計的空間辞書を用いた方向統計量モデルに基づく複数人会話における話者識別,”日本音響学会 秋季研究発表会 2016.
- 荒木, 小野, 木下, デルクロア, "非同期分散マイクロホンアレイを用いた実環境複数人会話音声認識に関する初期検討," 日本音響学会 秋季研究発表会 2017
- 伊藤、荒木、中谷, "FastFCA:空間共分散行列の同時対角化に基づく時変複素ガウス分布を用いた音源分離法の高速化," 日本音響学会春季研究発表会 , 2018.
- 荒木, 小野、木下、デルクロア, "非同期分散マイクロホンアレイにおける音源の移動に頑健なサンプリング周波数ミスマッチ推定," 日本音響学会春季研究発表会, 2019.
- 荒木, 小野、木下、デルクロア, "音源移動条件下での非同期分散マイクロホンアレイの同期処理とそれに基づく音源分離," 日本音響学会秋季研究発表会, 2019.
- 新井, 荒木, 小川, 木下, 中谷、山本, 入野 ,"DNN 音声認識システムによる単語了解度予測," .日本音響学会秋季研究発表会, 2019.
学位論文
- Convolutive Blind Speech Separation with Independent Component Analysis and Sparse Component Analysis, 北海道大学, 平成19年3月.
解説記事
- 牧野昭二, 荒木章子, 向井良, 澤田宏, ''畳込み混合のブラインド音源分離, '' システム/制御/情報, vol.48, no.10, pp.401-408, 2004.
- 澤田 宏,荒木章子,牧野 昭二, "音源分離技術の最新動向", 電子情報通信学会学会誌, 91(4), 292-296, 2008年4月.
- 伊藤信貴, 荒木章子, 中谷智広, “どんな環境でも聞きたい音を聞き分ける,” 日本音響学会誌, vol. 71, no. 3, pp. 136-142, Mar. 2015.(招待論文)
招待講演
-
荒木章子, ``残響下でのブラインド音源分離 ?マイクロホンアレイ技術との関連とその利用?,''
音響学会関西支部2002年度若手研究者交流研究発表会 招待講演I-1, 2002.
- 三好, 中谷, 向井, 澤田, 引地, 荒木, 木下, ``ブラインド信号処理技術の研究動向,''信学技報, vol. 104, No. 143, EA-2004-21, pp. 23--30, 2004.
- 荒木, "変動する環境における音声のブラインド音源分離," 東京工業大学 男女共同参画推進パネルディスカッション, Nov. 2010.
- 澤田宏,荒木章子, "時間周波数マスクによる実環境でのブラインド音源分離", 電子情報通信学会 技術研究報告,vol. 110, no. 331, EA2010-104, pp. 43-48, 2010年12月.
- 荒木章子,藤本雅清,吉岡拓也,堀貴明,中谷智広, "複数人会話シーン分析におけるマイクロホンアレイ音声処理", 電子情報通信学会 技術研究報告,vol. 111, no. 28, pp. 83-88, 2011年5月.
- 荒木章子, "いつ誰が話したか?を即座に分析!−複数人対話のリアルタイムシーン分析ー", 千葉工業大学、第5回CIT音響フォーラム、2011年10月.
- 荒木章子「音声インタフェースを支える音響信号処理技術〜コミュニケーションシーン分析を例題に〜」 MathWorks Day ユーザー講演、2014年7月.
- 荒木章子, 堀 貴明, 中谷智広, "会話シーン分析の複数人自由会話音声認識における音声強調," 信学技報, vol. 114, no. 274, EA2014-25, pp. 9-14, 2014年10月.
その他の文章
- 荒木章子,"私のすすめるこの一冊", 日本音響学会誌, vol. 62, no. 2, p. 142--143, 2006.
- 荒木章子,"NTTにおける男女共同参画への取組み(男女共同参画のページ)", 電子情報通信学会誌, vol.91, no.1, pp.72-73, 2008.
- 荒木章子,"国際会議報告 ICASSP2009", 電子情報通信学会誌, vol.92, no. 12, p. 1040, 2009.
受賞
- 第19回粟屋潔学術奨励賞 (日本音響学会2001年秋季)
- Best Paper Award (International Workshop on Acoustic Echo and Noise Control) (2003.9)
- 電気通信普及財団第19回テレコムシステム技術賞 (2004.3)
- 電子情報通信学会 平成17年度 学術奨励賞 (2005年電子情報通信学会ソサイエティ大会) (2006.3.25)
- 第3回 日本音響学会独創研究奨励賞 板倉記念(2008.3.18)
- 平成26年度 科学技術分野の文部科学大臣表彰 若手科学者賞, "音響信号のブラインド音源分離とその応用に関する先駆的研究," (2014.4.15)
- IEEE Best paper award, Apr. 2015 (共著).
学会活動
- ICA2003: Organizing committee member
- IWAENC2003: Finance chair
- EUSIPCO2006: Technical Program Committee Member, Special session co-organizer (on Underdetermined Sparse Audio Source Separation)
- WASPAA2007: Registration co-chairs
- ISCAS2008: Special session co-organizer (on Blind Separation and Dereverberation of Speech and Audio Signals)
- SiSEC2008(Signal Separation Evaluation Campaign): Evaluation chairs
- SiSEC2010(Signal Separation Evaluation Campaign): Evaluation chairs
- SiSEC2011(Signal Separation Evaluation Campaign): Evaluation chairs
- 電子情報通信学会 和文論文誌A 編集委員
- IEEE Audio & Acoustic Signal Processing Technical Committee Member, 2014年1月--2019年12月
- IEEE WIE (Women in Engineering), Kansai Section, Vice Chair, 2014年2月--2015年12月
- IEEE WIE (Women in Engineering), Kansai Section, Chair Jan. 2016-- Dec. 2017.
- IEEE Signal Processing Society HSCMA (Hands-free Speech Communication and Microphone Arrays) 2017, Technical Program Chair, Mar. 2016 -- Mar. 2017.
- IEEE WASPAA (Workshop on Applications of Signal Processing to Audio and Acoustics) 2017, Far East Liaison, Sept. 2016 -- Nov. 2017.
- IEEE IWAENC (International Workshop on Acoustic Signal Enhancement) 2018, Publications Chair, July 2017 -- Sept. 2018.
- 日本音響学会 理事 (広報電子化担当) 2017年5月--2021年5月
その他
- 東京大学大学院 情報理工学研究科 非常勤講師 (システム情報工学特論 I) 2004.4.
- Winter School on Neuroinformatics, invited lecturer, Sogang University, Seoul, January 29-30, 2009.
- 同志社大学 理工学部 嘱託講師(特別講義B:音声情報処理技術), 秋学期, 2009-2010.
- 奈良先端科学技術大学院大学 講師(ゼミナールI) 2012年7月
修士(東大安藤研)
: 蝸牛基底膜への高効率伝達理論とその音響センサへの応用
<-目的- 蝸牛構造の理解と蝸牛基底膜を模したセンサの感度向上>
基底膜を模したfishbone型音響センサの
入力インピーダンスを純抵抗にする方策を模索
↓
センサのインピーダンスと空気のインピーダンスをマッチさせる
エクスポネンシャルホーンを作成
↓
信号検出回路を用いて、センサ出力の増加を確認
-修論発表OHP(2MB)
-荒木,日下部,小野,安藤,``蝸牛基底膜を模擬したfishbone音響センサの最適検出機構とその実験'', 第38回計測自動制御学会学術講演会予稿集, 1999 (ps.gz)
-荒木,日下部,小野,安部,安藤,``入力インピーダンスに着目した蝸牛基底膜モデルの解析と応用'',電気学会センサシステム応用研究会資料 pp43-48, 1998 (ps.gz)
(訂正:1頁目最後の式 Y(x,w) → Y(x,w)^{-1})
-安藤,小野,荒木, "蝸牛コルチ器のFM-AM検出モデルとそのセンサ応用," 電気学会センサシステム応用研究会, SSA-98-18, pp.31--36, 東京, 11月, 1998
-安藤,荒木,小野,来海,原田,池内, "全ディジタル型可変周波数特性フィッシュボーン音響センサ," 電気学会センサシステム応用研究会, SSA-00-8, pp.41-46, 東京, 3月, 2000
-S. Ando, S. Araki, N. Ono, A. Kimachi, M. Harada and N. Ikeuchi, "Fishbone Acoustic Sensor with Digital PWM Controlled Frequency Characteristics," Technical Digest of the 17th Sensor Symposium, pp.359--362, Kawasaki, May 2000
学士(東大藤村研)
: 適応的カテゴリー分解に関する研究
<-内容- 多重分光リモートセンシング画像の、各カテゴリーのスペクトルと占有面積率の推定>
-竹内, 荒木, 喜安, 藤村,``適応的カテゴリー分解による画素内混在比の推定'', 第37回計測自動制御学会学術講演会予稿集, Vol.1, pp.191-192 (1998) abstract
-S. Kiyasu, S. Araki , H. Takeuchi and S. Fujimura
``Adaptive Spectral Unmixing for Estimation of Component Proportion'',
Proc. of the 1998 International Symposium on Noise Reduction for
Imaging and Communication Systems (ISNIC'98), pp.239-244 (1998)
back to HOME