画像を説明する多言語音声データを利用したクロスモーダル探索

Publication
In 信学技報