首页 | 官方网站   微博 | 高级检索  
     

基于KL散度的策略优化
引用本文:李建国,赵海涛,孙韶媛.基于KL散度的策略优化[J].计算机科学,2019,46(6).
作者姓名:李建国  赵海涛  孙韶媛
作者单位:华东理工大学信息科学与工程学院 上海200237;东华大学信息科学与技术学院 上海201620
基金项目:国家自然科学基金;上海市科委基础研究项目
摘    要:

关 键 词:强化学习  KL散度  策略优化  连续动作空间
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号