多Agent Q学习几点问题的研究及改进 Study for some problems of multi-agent Q-learning and improving期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

多Agent Q学习几点问题的研究及改进

引用本文：	孟祥萍,王圣镔,王欣欣.多Agent Q学习几点问题的研究及改进[J].计算机工程与设计,2009,30(9).

作者姓名：	孟祥萍王圣镔王欣欣

作者单位：	1. 长春工程学院电气与信息学院,吉林,长春,130012 2. 东北电力大学信息工程学院,吉林,吉林,132012

基金项目：	教育部科学技术研究项目，吉林省科技发展计划

摘要：	提出了一种新颖的基于Q-学习,蚁群算法和轮盘赌算法的多Agent强化学习.在强化学习算法中,当Agent数量增加到足够大时,就会出现动作空间灾难性问题,即:其交互困难,学习速度骤然下降.另外,由于Agent是利用Q值来选择下一步动作的,因此,在学习早期,动作的选择严重束缚于高Q值.在这里,把蚁群算法,轮盘赌算法和强化学习三者结合起来,期望解决上述提出的问题.最后,对新算法的理论分析和实验结果都证明了改进的Q学习是可行的,并且可以有效的提高学习效率.
关键词：	多Agent强化学习算法蚁群算法轮盘赌算法 Q值动作空间灾难
Study for some problems of multi-agent Q-learning and improving

MENG Xiang-ping,WANG Sheng-bin,WANG Xin-xin.Study for some problems of multi-agent Q-learning and improving[J].Computer Engineering and Design,2009,30(9).

Authors:	MENG Xiang-ping WANG Sheng-bin WANG Xin-xin

Abstract:

Keywords:
本文献已被维普万方数据等数据库收录！

设为首页 | 免责声明 | 关于勤云 | 加入收藏