首页 | 官方网站   微博 | 高级检索  
     

双足机器人步态控制的深度强化学习方法
引用本文:冯春,张祎伟,黄成,姜文彪,武之炜.双足机器人步态控制的深度强化学习方法[J].计算机集成制造系统,2021,27(8):2341-2349.
作者姓名:冯春  张祎伟  黄成  姜文彪  武之炜
作者单位:常州工学院航空与机械工程学院,江苏常州 213032
摘    要:针对双足机器人行走过程中的步态稳定控制问题,提出一种改进深度Q网络的深度强化学习方法.首先,将深度Q网络算法与确定性策略梯度相结合,提出用修正Double-Q网络优化操作一评论网络的评论网络,给出一种改进的深度Q网络;然后,建立双足机器人连杆模型,在常规的平整路面上将改进的深度Q网络用于作为智能体的双足机器人进行步态控制训练.MATLAB仿真结果表明,与深度Q网络和深度确定性策略梯度算法相比,所提算法有更好的训练速度且其回报曲线具有良好的平滑性.在CPU训练下,经过20 h左右深度强化学习能够完成智能体训练.双足机器人在较小的力矩和长距离下能够稳定快步行走.

关 键 词:双足机器人  步态控制  深度强化学习  智能体  操作—评论  改进深度Q网络算法

Deep reinforcement learning method for biped robot gait control
FENG Chun,ZHANG Yiwei,HUANG Cheng,JIANG Wenbiao,WU Zhiwei.Deep reinforcement learning method for biped robot gait control[J].Computer Integrated Manufacturing Systems,2021,27(8):2341-2349.
Authors:FENG Chun  ZHANG Yiwei  HUANG Cheng  JIANG Wenbiao  WU Zhiwei
Abstract:
Keywords:
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号