首页 | 官方网站   微博 | 高级检索  
     

移动机器人路径规划强化学习的初始化
作者姓名:宋勇  李贻斌  李彩虹
作者单位:1. 山东大学控制科学与工程学院,山东济南250061;山东大学(威海)机电与信息工程学院,山东威海264209
2. 山东大学控制科学与工程学院,山东济南,250061
3. 山东理工大学计算机科学与技术学院,山东淄博,255012
基金项目:国家自然科学基金资助项目(61075091, 61174054); 国家自然科学基金青年基金资助项目(61105100).
摘    要:针对现有机器人路径规划强化学习算法收敛速度慢的问题,提出了一种基于人工势能场的移动机器人强化学习初始化方法.将机器人工作环境虚拟化为一个人工势能场,利用先验知识确定场中每点的势能值,它代表最优策略可获得的最大累积回报.例如障碍物区域势能值为零,目标点的势能值为全局最大.然后定义Q初始值为当前点的立即回报加上后继点的最大折算累积回报.改进算法通过Q值初始化,使得学习过程收敛速度更快,收敛过程更稳定.最后利用机器人在栅格地图中的路径对所提出的改进算法进行验证,结果表明该方法提高了初始阶段的学习效率,改善了算法性能.

关 键 词:移动机器人  强化学习  人工势能场  路径规划  Q值初始化
收稿时间:2011-10-17
修稿时间:2012-07-21
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《控制理论与应用》浏览原始摘要信息
点击此处可从《控制理论与应用》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号

京公网安备 11010802026262号