研究展示

データと学習の科学

02

システム障害を早期に解決する方法を見つけます

ニューラルネットを用いた障害復旧コマンドの生成

どんな研究

システム障害の発生時に、その障害を復旧させるコマンド列を自動で推定し、その信頼度とともに運用者へ提示します。系列変換を行うニューラルネットワークの一種であるSeq2Seqを用い、障害時に取得できるアラームやログを、機械実行可能な復旧コマンド列に変換します。

どこが凄い

従来、復旧コマンドの検討は、運用者の知見に依存することが多く、運用品質のばらつきや復旧の長時間化が問題となっていました。運用者は、本技術が推定したコマンドの実行可否を、同時に提示される信頼度に基づき判断するだけで、多くの復旧作業を半自動で完了させることができます。

めざす未来

本技術を用いることで、障害復旧を迅速化し、お客様へのサービス影響を最小限に抑えることができます。今後は、推定された復旧コマンドが対象システムの性能や可用性に及ぼす影響も考慮し、コマンド実行可否の判断も自動化することで、システムの完全自動復旧の実現をめざします。

関連文献

  1. H. Ikeuchi, A. Watanabe, T. Hirao, M. Morishita, M. Nishino, Y. Matsuo, K. Watanabe, “Recovery command generation towards automatic recovery in ICT systems by Seq2Seq learning,” in Proc. of IEEE/IFIP Network Operations and Management Symposium (NOMS), 2020, to appear.
  2. T. Kimura, A. Watanabe, T. Toyono, K. Ishibashi, “Proactive failure detection learning generation patterns of large-scale network logs,” IEICE Transactions on Communications, Vol. E102-B, No. 2, pp. 306-316, 2019.

ポスター

展示説明ムービー

連絡先

池内 光希 (Hiroki Ikeuchi) ネットワーク基盤技術研究所
Email: