研究展示

データと学習の科学

01

WWW上のみんな、オラに力を分けてくれ!

WWW上のリソースを活用した機械学習用データ作成手法

どんな研究

WWW上の多種多様、大量のデータに、WWW利用者の力を借りて機械学習用の正解ラベルを付与する仕組みを提供します。既存のWebブラウザにラベリング機能を組み込むことで簡単にラベリングできます。また、サーバと連携して様々な報酬を提供することで、利用者のラベリングを促進します。

どこが凄い

教師あり機械学習で利用する大量かつ高品質な正解ラベル付きデータを作成するには、通常膨大な人的、金銭的リソースが必要です。WWW上のデータ素材に対してWWWの利用者に自発的にラベリングしてもらうというアプローチをとることで、データの準備からラベリングまでを低コストに実現します。

めざす未来

WWW上のデータをWWWの利用者自身が整理していくことができる本技術は、いわばクラウドソーシングの新たな形態を実現します。本技術によって機械学習用の学習データを作成できるようになれば、機械学習を利用した多種多様なサービスをより安価に創出できるようになるでしょう。

関連文献

  1. Y. Shirai, Y. Kishino, Y. Yanagisawa, S. Mizutani, T. Suyama, “WWW横断型ヒューマンコンピュテーション,” 第27回インタラクティブシステムとソフトウェアに関するワークショップ(WISS2019), 2019.
  2. Y. Shirai, Y. Kishino, Y. Yanagisawa, S. Mizutani, T. Suyama, “Building human computation space on the www: labeling web contents through web browsers,” in Proc. The seventh AAAI Conference on Human Computation and Crowdsourcing (HCOMP2019), 2019.

ポスター

展示説明ムービー

関連コンテンツ

WWWゲーム化技術:テキストモンスターのデモ動画

連絡先

白井 良成 (Yoshinari Shirai) 協創情報研究部 知能創発環境研究グループ
Email: