移动机器人路径规划强化学习的初始化 |
| |
作者姓名: | 宋勇 李贻斌 李彩虹 |
| |
作者单位: | 1. 山东大学控制科学与工程学院,山东济南250061;山东大学(威海)机电与信息工程学院,山东威海264209 2. 山东大学控制科学与工程学院,山东济南,250061 3. 山东理工大学计算机科学与技术学院,山东淄博,255012 |
| |
基金项目: | 国家自然科学基金资助项目(61075091, 61174054); 国家自然科学基金青年基金资助项目(61105100). |
| |
摘 要: | 针对现有机器人路径规划强化学习算法收敛速度慢的问题,提出了一种基于人工势能场的移动机器人强化学习初始化方法.将机器人工作环境虚拟化为一个人工势能场,利用先验知识确定场中每点的势能值,它代表最优策略可获得的最大累积回报.例如障碍物区域势能值为零,目标点的势能值为全局最大.然后定义Q初始值为当前点的立即回报加上后继点的最大折算累积回报.改进算法通过Q值初始化,使得学习过程收敛速度更快,收敛过程更稳定.最后利用机器人在栅格地图中的路径对所提出的改进算法进行验证,结果表明该方法提高了初始阶段的学习效率,改善了算法性能.
|
关 键 词: | 移动机器人 强化学习 人工势能场 路径规划 Q值初始化 |
收稿时间: | 2011-10-17 |
修稿时间: | 2012-07-21 |
本文献已被 CNKI 万方数据 等数据库收录! |
| 点击此处可从《控制理论与应用》浏览原始摘要信息 |
|
点击此处可从《控制理论与应用》下载免费的PDF全文 |
|