たくさんのデータの中から素早く知識を発見
計算の枝刈りを活用した高速かつ厳密な大規模データ解析
NTT コミュニケーション科学基礎研究所 メディア情報研究部
藤原 靖宏
藤原 靖宏
今、データが知の源泉となっています。「データは新しい石油である。」というフレーズに注目が集まり、人工知能に基づいたデータ解析を効果的に活用することに関心が高まっています。しかし、膨大な収集データに対する解析には多大な計算コストが必要です。莫大な計算コストを低減するために近似的な処理を行うことが一般的ですが、近似処理では正確な解析結果を得ることができないという問題があります。本講演では、近似と異なり結果を変えない計算の枝刈りを行うことにより高速性と厳密性を両立したデータ解析を実現する代表的な手法を紹介します。
関連文献
[1] Y. Ida, S. Kanai, Y. Fujiwara, T. Iwata, K. Takeuchi, H. Kashima, “Fast deterministic CUR matrix dec omposition with accuracy assurance,” in Proc. the 37th International Conference on Machine Learning (ICML), 2020
[2] J. Arai, Y. Fujiwara, M. Onizuka, “GuP: fast subgr aph matching by guard-based pruning,” in Proc. the ACM on Management of Data (SIGMOD), 2023
[3] Y. Fujiwara, A. Kumagai, S. Kanai, Y. Ida, N. Ueda, “Efficient algorithm for the b-matching graph,” in Proc. the 26th ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD), 2020

藤原 靖宏
NTT コミュニケーション科学基礎研究所 メディア情報研究部 特別研究員。 2 0 0 1 年早稲田大学理工学部電気電子情報工学科卒業。2 0 0 3 年早稲田大学 大学院理工学研究科電気工学専攻修士課程修了。同年日本電信電話株式 会社入社。2011年東京大学大学院情報理工学系研究科電子情報学専攻博士 後期課程修了。博士(情報理工学)。データベース、人工知能、機械学習の研究に従事。電子情報通信学会、情報処理学会、日本データベース学会各会員。