双足机器人步态控制的深度强化学习方法 Deep reinforcement learning method for biped robot gait control期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

双足机器人步态控制的深度强化学习方法

引用本文：	冯春,张祎伟,黄成,姜文彪,武之炜.双足机器人步态控制的深度强化学习方法[J].计算机集成制造系统,2021,27(8):2341-2349.

作者姓名：	冯春张祎伟黄成姜文彪武之炜

作者单位：	常州工学院航空与机械工程学院,江苏常州 213032

摘要：	针对双足机器人行走过程中的步态稳定控制问题,提出一种改进深度Q网络的深度强化学习方法.首先,将深度Q网络算法与确定性策略梯度相结合,提出用修正Double-Q网络优化操作一评论网络的评论网络,给出一种改进的深度Q网络;然后,建立双足机器人连杆模型,在常规的平整路面上将改进的深度Q网络用于作为智能体的双足机器人进行步态控制训练.MATLAB仿真结果表明,与深度Q网络和深度确定性策略梯度算法相比,所提算法有更好的训练速度且其回报曲线具有良好的平滑性.在CPU训练下,经过20 h左右深度强化学习能够完成智能体训练.双足机器人在较小的力矩和长距离下能够稳定快步行走.
关键词：	双足机器人步态控制深度强化学习智能体操作—评论改进深度Q网络算法
Deep reinforcement learning method for biped robot gait control

FENG Chun,ZHANG Yiwei,HUANG Cheng,JIANG Wenbiao,WU Zhiwei.Deep reinforcement learning method for biped robot gait control[J].Computer Integrated Manufacturing Systems,2021,27(8):2341-2349.

Authors:	FENG Chun ZHANG Yiwei HUANG Cheng JIANG Wenbiao WU Zhiwei

Abstract:

Keywords:
本文献已被 CNKI 万方数据等数据库收录！

设为首页 | 免责声明 | 关于勤云 | 加入收藏