移动机器人路径规划强化学习的初始化期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

移动机器人路径规划强化学习的初始化

作者姓名：	宋勇李贻斌李彩虹

作者单位：	1. 山东大学控制科学与工程学院,山东济南250061;山东大学(威海)机电与信息工程学院,山东威海264209 2. 山东大学控制科学与工程学院,山东济南,250061 3. 山东理工大学计算机科学与技术学院,山东淄博,255012

基金项目：	国家自然科学基金资助项目(61075091, 61174054); 国家自然科学基金青年基金资助项目(61105100).

摘要：	针对现有机器人路径规划强化学习算法收敛速度慢的问题,提出了一种基于人工势能场的移动机器人强化学习初始化方法.将机器人工作环境虚拟化为一个人工势能场,利用先验知识确定场中每点的势能值,它代表最优策略可获得的最大累积回报.例如障碍物区域势能值为零,目标点的势能值为全局最大.然后定义Q初始值为当前点的立即回报加上后继点的最大折算累积回报.改进算法通过Q值初始化,使得学习过程收敛速度更快,收敛过程更稳定.最后利用机器人在栅格地图中的路径对所提出的改进算法进行验证,结果表明该方法提高了初始阶段的学习效率,改善了算法性能.
关键词：	移动机器人强化学习人工势能场路径规划 Q值初始化
收稿时间：	2011-10-17
修稿时间：	2012-07-21
本文献已被 CNKI 万方数据等数据库收录！
	点击此处可从《控制理论与应用》浏览原始摘要信息
	点击此处可从《控制理论与应用》下载免费的PDF全文

设为首页 | 免责声明 | 关于勤云 | 加入收藏