关键词:学习
本文提出了一种机器人基于强化学习在动态环境中的路径规划方法,通过利用改进的值函数逼近网络CMAC, 使得系统具有在连续状态中在线学习的特点,因此使决策系统具有自适应性。通过自适应的学习,机器人控制器建立起了环境状态到控制输出的直接映射,可以使机 器人在动态未知的环境中有效避开障物并以最短路径到达目标位置。从仿真的结果来看,具有很好的适应性,路径规划算法的设计相对来说也比较简单,同时具有较 好的实时性能,是解决动态环境中路径规划问题的一种可行方法。
1 路径规划问题 1
2 常用机器人路径规划方法 2
2.1传统路径规划方法 2
2.2智能路径规划方法 5
3 动态环境的机器人自适应路径规划 7
3.1改进CMAC网络的Q-Learning系统 8
3.2路径规划控制总体模型设计 9
3.2学习系统的环境感知及行为模型 10
3.3强化函数的设定 11
4 系统学习结果及讨论 12
5小结 14
本文全文为PDF文档,需要带中文字库的Adobe Reader(5.0以上版本)