MACC'97 一般セッション(学習,進化計算)論文
- 学習型行動選択ネットワーク: L-ANA
- 栗原 聡,菅原 俊治
- NTT光ネットワークシステム研究所
- 連絡先: kurihara@square.brl.ntt.co.jp
- 梗概
行動選択ネットワークを経験強化型の強化学習に適応したL-ANAを提案する。
従来の強化学習法であるprofit-sharingに比べ、動的な環境の変化に対してよ
りロバスト性を有し、実世界やインターネットなど複雑で動的な環境を対象と
する自律行動主体に適した学習法である。また活性伝幡のためのパラメータを
操作することで、容易に学習の特性を制御することができる。今回はシミュレー
ションによりL-ANAの基本的有効性の確認を行なった。
- キーワード
強化学習、記憶エージェント、活性伝播、ロバスト性、実世界
-
論文PSファイル(+gzip)
トップページへ戻る
Wed Jan 21 09:37:36 JST 1998