首页 | 官方网站   微博 | 高级检索  
     

异构无线网络中基于强化学习的频谱管理算法
引用本文:张文柱,邵丽娜.异构无线网络中基于强化学习的频谱管理算法[J].西安电子科技大学学报,2011,38(4):32-37.
作者姓名:张文柱  邵丽娜
作者单位:西安电子科技大学综合业务网理论及关键技术国家重点实验室;
基金项目:国家杰出青年科学基金资助项目(60725105); 国家重点基础研究发展计划(973计划)课题资助项目(2009CB320404); 长江学者和创新团队发展计划资助项目(IRT0852); 国家自然科学基金资助项目(61072068,60872045); 中央高校基本科研业务费专项资助项目(JY10000901031)
摘    要:提出了一种基于归一化径向基函数的自适应启发评价强化学习算法,用于异构无线网络系统中自主的动态频谱分配.该算法利用归一化径向基函数自适应构建状态空间,加快学习速度;利用自适应启发评价机制减少不必要的探索,提高学习效率.通过与无线环境交互,算法学会为不同接入网内的各个会话动态分配合适的频段.仿真结果表明,在同等网络条件下,该算法能获取更好的频谱利用率和服务质量,性能优于确定性频谱分配策略和一般的动态频谱分配策略.

关 键 词:异构无线网络  动态频谱分配  强化学习  归一化径向基函数
收稿时间:2010-12-14

Dynamic spectrum allocation algorithm for heterogeneous radio networks based on reinforcement learning
ZHANG Wenzhu,SHAO Lina.Dynamic spectrum allocation algorithm for heterogeneous radio networks based on reinforcement learning[J].Journal of Xidian University,2011,38(4):32-37.
Authors:ZHANG Wenzhu  SHAO Lina
Affiliation:(State Key Lab. of Integrated Service Networks, Xidian Univ., Xi'an  710071, China)
Abstract:An adaptive heuristic critic(AHC) Reinforcement Learning algorithm is presented for the dynamic spectrum allocation in an autonomously deciding mode in heterogeneous radio networks based on the normalized radial basis function(NRBF).The algorithm accelerates the learning speed by utilizing the NRBF when constructing the state space,and improves the learning efficiency by using the AHC scheme to reduce the unnecessary exploration.Through interactions with the radio environment,it learns to allocate the prope...
Keywords:heterogeneous radio networks  dynamic spectrum allocation  reinforcement learning  normalized radial basis function  
本文献已被 CNKI 等数据库收录!
点击此处可从《西安电子科技大学学报》浏览原始摘要信息
点击此处可从《西安电子科技大学学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号