基于改进深度强化学习的移动机器人路径规划 Mobile robot path planning based on improved deep reinforcement learning期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

基于改进深度强化学习的移动机器人路径规划

引用本文：	王军,杨云霄,李莉.基于改进深度强化学习的移动机器人路径规划[J].电子测量技术,2021,44(22):19-24.

作者姓名：	王军杨云霄李莉

作者单位：	沈阳化工大学计算机科学与技术学院沈阳110142;辽宁省化工过程工业智能化技术重点实验室沈阳110142

摘要：	针对传统深度强化学习中移动机器人在稀疏奖励环境下只有在规定时间步内到达目标位置才能得到积极奖励,中间过程的每一步都是负面奖励的路径规划问题.提出了基于改进深度Q网络的路径规划方法,在移动机器人在探索过程中,对以真实目标为条件的轨迹进行采样,在经验回放过程中,把移动机器人已经到达的状态来代替真正的目标,这样移动机器人可以获得足够的积极奖励信号来开始学习.通过深度卷积神经网络模型,将原始RGB图像作为输入,通过端对端的方法训练,利用置信区间上界探索策略和小批量样本的方法训练神经网络参数,最后得到上、下、左、右4个动作的Q值.在相同的仿真环境中结果表明,该算法提升了采样效率,训练迭代更快,并且更容易收敛,避开障碍物到达终点的成功率增加40％左右,一定程度上解决了稀疏奖励带来的问题.
关键词：	深度强化学习路径规划稀疏奖励移动机器人后见经验回放
Mobile robot path planning based on improved deep reinforcement learning

Wang Jun,Yang Yunxiao,Li Li.Mobile robot path planning based on improved deep reinforcement learning[J].Electronic Measurement Technology,2021,44(22):19-24.

Authors:	Wang Jun Yang Yunxiao Li Li

Abstract:

Keywords:
本文献已被万方数据等数据库收录！

设为首页 | 免责声明 | 关于勤云 | 加入收藏