首页 | 官方网站   微博 | 高级检索  
     

改进的模糊Sarsa学习
引用本文:陈学松,杨宜民.改进的模糊Sarsa学习[J].北京邮电大学学报,2011,34(2):31-34.
作者姓名:陈学松  杨宜民
作者单位:广东工业大学应用数学学院,广州,510006;广东工业大学自动化学院,广州,510090;广东工业大学自动化学院,广州,510090
基金项目:国家自然科学基金项目(60974019); 广东省自然科学基金项目(9451009001002686)
摘    要:为了解决模糊Sarsa学习(FSL)无法在线自适应调节学习因子和不能处理学习过程中探索与利用的平衡问题,提出了一种改进的模糊Sarsa学习(IFSL)算法. 在FSL基础上,引入自适应学习率产生器来在线调节学习因子,增加模糊平衡器控制探索和利用的程度. 给出了IFSL的结构框图,证明了IFSL中可调节权向量具有平衡不动点. 仿真结果表明,与FSL相比,IFSL能加快系统的学习收敛速度,具有较好的学习性能.

关 键 词:强化学习  模糊控制  模糊Sarsa学习  探索  利用
收稿时间:2010-04-17

An Improved Fuzzy Sarsa Learning
CHEN Xue-song,YANG Yi-min.An Improved Fuzzy Sarsa Learning[J].Journal of Beijing University of Posts and Telecommunications,2011,34(2):31-34.
Authors:CHEN Xue-song  YANG Yi-min
Affiliation:CHEN Xue-song1,2,YANG Yi-min2(1.Faculty of Applied Mathematics,Guangdong University of Technology,Guangzhou 510006,China,2.Faculty of Automation,Guangzhou 510090,China)
Abstract:It is difficult for fuzzy Sarsa learning(FSL) to tune learning rate and balance exploration vs.exploitation,so an improved FSL(IFSL) method based on FSL is presented.In the method,an adaptive learning rate generator for tuning learning rate on-line and a fuzzy balancer for controlling the degree of exploration vs.exploitation are introduced.The diagram of IFSL is given,and the weight vector of IFSL with stationary action selection policy converges to a unique value is proved.Simulation results show that IFS...
Keywords:reinforcement learning  fuzzy control  fuzzy Sarsa learning  exploration  exploitation  
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《北京邮电大学学报》浏览原始摘要信息
点击此处可从《北京邮电大学学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号