MACC'97 特別セッション(ロボカップ)論文
- サッカーエージェントにおける強化学習を用いたポジショニング
- 安藤友人
- 東京工業大学情報理工学研究科
- 連絡先: andou@is.titech.ac.jp
- 梗概
エージェントの高レベル協調行動は人間にとって最も記述が困難なものの一つ
であり、強化学習を用いて獲得することは非常に有力な方法である。しかし強
化学習を用いて高レベル協調行動を獲得する際には次のような点が問題となる。
1)局所最適政策からの脱出のためには学習中に幅広い政策を選択する必要があ
るが、協調行動の獲得のためには最善の政策を高頻度に選択しなければならな
い。2)高レベル行動は複数の行動の組合せであるため、実行可能な政策が限定
されることが多い。本論文では、観察から理想的な政策を推論して強化すると
いう「観察による強化」を行うことで、最善の政策を行いながら幅広い政策を
強化することや、現時点では実行不能であるが有効であるような政策を強化す
ることを提案する。そしてサッカーエージェントのポジション問題を例題とし
て、この方法が有効であることを確かめた。
- キーワード
強化学習、マルチエージェント、ニューラルネット、ロボカップ
-
論文PSファイル(+gzip)
トップページへ戻る
Wed Jan 21 09:37:36 JST 1998