研究展示

データと学習の科学

06

そのデータ、本当に偏ってますか?

決定グラフを用いた組合せ的相関検定

どんな研究

病気が流行したとき、その流行に地域性があるかないかを知ることは重要です。組合せ的相関検定では観測データである地域別病気発症率と地域の隣接関係から流行の地域性の有無を検定します。具体的には観測データの偏りとその稀さを計算し、病気の地域性の有無を判定します。

どこが凄い

偏りScan統計量として、その稀さP値(その統計量が考えられる全ての観測パターンのうち上位何%であるか)として計算されます。これらを愚直に計算すると47都道府県別の検定には1億年以上かかります。私達はこの検定時間を決定グラフと呼ばれるデータ構造を用いることで1日に短縮します。

めざす未来

本手法は流行の地域性のみでなく、センサ網上の侵入者の検知や購買履歴中の顕著な組合せの発見など、様々な組合せ構造に適用可能な一般的な手法です。本手法により、日々蓄積される様々な組合せデータに潜む重要な情報を自動的に抽出可能になります。

関連文献

  1. M. Ishihata, T. Maehara, “Exact Bernoulli scan statistics by binary decision diagrams,” The 28th International Joint Conference on Artificial Intelligence (IJCAI-2019), 2019.

ポスター

展示説明ムービー

動画の公開は終了いたしました。ご了承くださいますようお願いいたします。

連絡先

石畠 正和 (Masakazu Ishihata) 協創情報研究部 知能創発環境研究グループ
Email: