首页 | 官方网站   微博 | 高级检索  
     

协同设计任务调度的多步Q学习算法
引用本文:陈圣磊,吴慧中,肖亮,朱耀琴.协同设计任务调度的多步Q学习算法[J].计算机辅助设计与图形学学报,2007,19(3):398-402,408.
作者姓名:陈圣磊  吴慧中  肖亮  朱耀琴
作者单位:南京理工大学计算机科学与技术学院,南京,210094
基金项目:总装备部预研项目 , 南京理工大学校科研和教改项目
摘    要:首先建立任务调度问题的目标模型,在分析Q学习算法的基础上,给出调度问题的马尔可夫决策过程描述;针对任务调度的Q学习算法更新速度慢的问题,提出一种基于多步信息更新值函数的多步Q学习调度算法.应用实例表明,该算法能够提高收敛速度,有效地解决任务调度问题.

关 键 词:任务调度  协同设计  强化学习  Q学习  多步Q学习  设计任务  调度算法  学习算法  Collaborative  Design  Task  Scheduling  收敛速度  应用  值函数  信息更新  任务调度问题  更新速度  过程描述  马尔可夫决策  分析  目标模型
收稿时间:2006-05-31
修稿时间:2006-05-312006-11-07

Multi-Step Q Learning Algorithm for Task Scheduling in Collaborative Design
Chen Shenglei,Wu Huizhong,Xiao Liang,Zhu Yaoqin.Multi-Step Q Learning Algorithm for Task Scheduling in Collaborative Design[J].Journal of Computer-Aided Design & Computer Graphics,2007,19(3):398-402,408.
Authors:Chen Shenglei  Wu Huizhong  Xiao Liang  Zhu Yaoqin
Abstract:
Keywords:task scheduling  collaborative design  reinforcement learning  Q learning  multi-step Q learning
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号