首页 | 官方网站   微博 | 高级检索  
     

基于动态融合目标的深度强化学习算法研究
引用本文:徐志雄,曹雷,张永亮,陈希亮,李晨溪.基于动态融合目标的深度强化学习算法研究[J].计算机工程与应用,2019,55(7):157-161.
作者姓名:徐志雄  曹雷  张永亮  陈希亮  李晨溪
作者单位:解放军陆军工程大学 指挥信息系统学院,南京,210000;解放军陆军工程大学 指挥信息系统学院,南京,210000;解放军陆军工程大学 指挥信息系统学院,南京,210000;解放军陆军工程大学 指挥信息系统学院,南京,210000;解放军陆军工程大学 指挥信息系统学院,南京,210000
基金项目:国家部委"十五"预研项目
摘    要:针对深度强化学习算法中存在的过估计问题,提出了一种目标动态融合机制,在Deep Q] Networks(DQN)算法基础上进行改进,通过融合Sarsa算法的在线更新目标,来减少DQN算法存在的过估计影响,动态地结合了DQN算法和Sarsa算法各自优点,提出了DTDQN(Dynamic Target Deep Q] Network)算法。利用公测平台OpenAI Gym上Cart-Pole控制问题进行仿真对比实验,结果表明DTDQN算法能够有效地减少值函数过估计,具有更好的学习性能,训练稳定性有明显提升。

关 键 词:深度强化学习  过估计  更新目标  动态融合

Research on Deep Reinforcement Learning Algorithm Based on Dynamic Fusion Target
XU Zhixiong,CAO Lei,ZHANG Yongliang,CHEN Xiliang,LI Chenxi.Research on Deep Reinforcement Learning Algorithm Based on Dynamic Fusion Target[J].Computer Engineering and Applications,2019,55(7):157-161.
Authors:XU Zhixiong  CAO Lei  ZHANG Yongliang  CHEN Xiliang  LI Chenxi
Affiliation:Institute of Command Information System, Army Engineering University, Nanjing 210000, China
Abstract:Aiming at the problem of overestimation in deep reinforcement learning algorithm, a target dynamic fusion mechanism is proposed. Based on the Deep Q] Networks(DQN) algorithm, an improvement is proposed to reduce the overestimation in DQN algorithm by incorporating the update target of Sarsa algorithm, while retaining the DQN algorithm to speed up the learning process, dynamically combining the respective advantages of the DQN algorithm and the Sarsa algorithm, the DTDQN (Dynamic Target Deep Q] Network) algorithm is proposed. The experiment of Carteole control problem on OpenAI Gym with open platform is carried out. The results show that DTDQN can effectively reduce the overvalue of the function, and improve the learning performance and the training stability obviously.
Keywords:deep reinforcement learning  overestimation  update target  dynamic fusion  
本文献已被 万方数据 等数据库收录!
点击此处可从《计算机工程与应用》浏览原始摘要信息
点击此处可从《计算机工程与应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号