Illusion Forum イリュージョンフォーラム
一覧

Illusion Forum イリュージョンフォーラム 錯聴 言語音知覚の頑健性 モザイク音声(劣化雑音音声)

説明を読む
前のデモ
次のデモ
そうさ方法

  この音声は、話し声を4つの周波数帯域に分割し、それぞれの帯域の振幅包絡を抽出して、同じ帯域の雑音にその振幅包絡を与え、最後に4つの帯域の雑音を足し合わせたものです。要するに、スペクトルの細かい特徴を破壊した、いわば粗いモザイクをかけた映像のような音声になっています(図1:音A(加工音声)、図2:音B(原音声)の、振幅波形(上段)とサウンドスペクトログラム(下段))。

図1 :音A(加工音声)

図1 :音A(加工音声)

図2:音B(原音声)

図2:音B(原音声)

  もともと、この音声は、人工内耳装用者の聞こえ方を模擬するために開発されました。このように非常に粗い情報だけでも、ある程度声の聞き取りが可能というのがこのデモのひとつのメッセージです。

  もうひとつのメッセージは、仮に最初何と言っているかわからなくても、いったん気づいてしまうと、もはやそのようにしか聞こえないほど、声を聞き取る上でトップダウンの効果は強力だということです。

(『音のイリュージョン』p.32-34)