关键词:智能体
1 研究多智能体系统的必要性 2
2 多智能体学习方法研究 3
2.1 多智能体学习的框架 3
2.2 双矩阵决策和马尔可夫决策过程 5
2.3 随机决策 7
3 多智能体系统中的强化学习 8
3.1 智能体强化学习方法分类 9
3.2 Hu 和Wellman算法 11
4 基于SLA进行行动预测的多智能体强化学习算法 12
4.1 基于SLA进行行动预测的多智能体强化学习算法 13
4.2 多机器人推箱子问题 15
4.3 试验及结果比较 16
5 小结 17
本文全文为PDF文档,需要带中文字库的Adobe Reader(5.0以上版本)
打开PDF文档
(或右键“目标另存为”)