Yasunori Ohishi

Senior Manager

NTT EAST, Inc.

Biography

Yasunori Ohishi is a senior manager, Head of Business Technology Development Section, Digial Design Department, Digital Transformation Headquaters in NTT EAST, Inc. His research interests include acoustic signal processing, multimedia content analysis, and music information retrieval.

Interests

Acoustic signal processing
Multimedia content analysis
Music information retrieval

Education

PhD in Information Science, 2009

Nagoya University
MSc in Information Science, 2006

Nagoya University
BEng in Electrical and Electronic Engineering and Information Engineering, 2004

Nagoya University

Recent Posts

A paper presented at EUSIPCO 2025

We are pleased to announce that our paper “Baseline Systems and Evaluation Metrics for Spatial Semantic Segmentation of Sound Scenes” by Binh Thien Nguyen, Masahiro Yasuda, Daiki Takeuchi, Daisuke Niizumi, Yasunori Ohishi, and Noboru Harada has been accepted to EUSIPCO 2025.

Yasunori Ohishi

May 23, 2025 1 min read Spatial Semantic Segmentation of Sound Scenes (S5)

Five papers presented at Interspeech 2025

We are pleased to announce that our group’s papers have been accepted to Interspeech 2025.

Yasunori Ohishi

May 23, 2025 1 min read General audio representation, Audio captioning, Voice Conversion

A paper presented at EMBC 2025

We are pleased to announce that our paper “Assessing the Utility of Audio Foundation Models for Heart and Respiratory Sound Analysis” by Daisuke Niizumi, Daiki Takeuchi, Masahiro Yasuda, Binh Thien Nguyen, Yasunori Ohishi, and Noboru Harada has been accepted to EMBC 2025.

Yasunori Ohishi

Apr 28, 2025 1 min read General audio representation

See all posts

Skills

Acoustic signal processing

Expert

Multimedia content analysis

Expert

Music information retrieval

Expert

Machine learning

Advanced

Bayesian statistics and modeling

Advanced

Python

Advanced

Recent Publications

Binh Thien Nguyen, Masahiro Yasuda, Daiki Takeuchi, Daisuke Niizumi, Yasunori Ohishi, Noboru Harada (2025). Baseline Systems and Evaluation Metrics for Spatial Semantic Segmentation of Sound Scenes. In EUSIPCO.

Cite Code Dataset Project arXiv

Daiki Takeuchi, Binh Thien Nguyen, Masahiro Yasuda, Yasunori Ohishi, Daisuke Niizumi, Noboru Harada (2025). CLAP-ART: Automated Audio Captioning with Semantic-rich Audio-Representation Tokenizer. In Interspeech.

Cite

Daisuke Niizumi, Daiki Takeuchi, Masahiro Yasuda, Binh Thien Nguyen, Yasunori Ohishi, Noboru Harada (2025). Towards Pre-training an Effective Respiratory Audio Foundation Model. In Interspeech.

Cite Code arXiv

See all publications

Projects

ConceptBeam

Target speech extraction based on “concept” or semantic information.

The Places Japanese audio caption corpus

Japanese spoken captions for the Places205 image dataset

Experience

Senior Manager

NTT EAST, Inc.

Jul 2025 – Present Shinjuku, Tokyo, Japan

Head of Business Technology Development Section, Digital Design Department, Digital Transformation Headquaters in NTT EAST, Inc.

Senior Research Scientist, Supervisor

NTT Communication Science Laboratories

Nov 2024 – Jun 2025 Atsugi, Kanagawa, Japan

Group Leader of Computational Modeling Research Group, Media Information Laboratory in NTT Communication Science Laboratories.

Senior Manager

NTT Communication Science Laboratories

Nov 2022 – Oct 2024 Keihanna, Kyoto, Japan

Head of Human Resources in NTT Communication Science Laboratories.

Senior Research Scientist

NTT Communication Science Laboratories

Jun 2021 – Oct 2022 Atsugi, Kanagawa, Japan

Leading basic researches on acoustic signal processing, crossmodal semantic learning, audio captioning, and sound event localization and detection. Presented in major international conferences such as ICASSP, Interspeech, and DCASE.

Assistant Manager

NTT Communication Science Laboratories

Apr 2019 – May 2021 Atsugi, Kanagawa, Japan

Administrative and clerical supports for researchers and budget managements in Media Information Laboratory and Moriya Research Laboratory.

Senior Research Scientist

NTT Communication Science Laboratories

Oct 2017 – Mar 2019 Atsugi, Kanagawa, Japan

Leading basic researches on crossmodal semantic learning and multimedia event detection.

Deputy Manager

NTT Data

Oct 2014 – Sep 2017 Toyosu, Tokyo, Japan

Project leader for robust media search services, ‘MediaSearch+’

Research Scientist

NTT Communication Science Laboratories

Apr 2009 – Sep 2014 Atsugi, Kanagawa, Japan

Leading basic researches on singing voice information processing and sound event detection. Presented in major international conferences such as ICASSP and Interspeech.

PhD Student

Nagoya University

Apr 2006 – Mar 2009 Nagoya, Aichi, Japan

Research for analysis-synthesis model of singing voice that characterize varied singing behaviors and its practical applications.

MSc Student

Nagoya University

Apr 2004 – Mar 2006 Nagoya, Aichi, Japan

Research for discrimination between singing and speaking voices.

BEng Student

Nagoya University

Apr 2003 – Mar 2004 Nagoya, Aichi, Japan

Research for statistical analysis for the word hierarchy using an encyclopedic corpus.

Contact

yasunori.ohishi.cy [at] east.ntt.co.jp
3-19-2 Nishi-shinjuku, Shinjuku, Tokyo 163-8019
yasunoriohishi