共查询到10条相似文献,搜索用时 15 毫秒
1.
多Agent协作的强化学习模型和算法 总被引:2,自引:0,他引:2
结合强化学习技术讨论了多Agent协作学习的过程,构造了一个新的多Agent协作学习模型。在这个模型的基础上,提出一个多Agent协作学习算法。算法充分考虑了多Agent共同学习的特点,使得Agent基于对动作长期利益的估计来预测其动作策略,并做出相应的决策,进而达成最优的联合动作策略。最后,通过对猎人。猎物追逐问题的仿真试验验证了该算法的收敛性,表明这种学习算法是一种高效、快速的学习方法。 相似文献
2.
热合玛·阿不都热西提 《数字社区&智能家居》2011,(23):5645-5646
通过计算机软件学习语言是随着信息技术的不断发展而采的一种学习方式.笔者通过研究现有的各类语言学习软件,提出了在计算机环境下维汉双语学习软件的设计与开发构想,论述了维汉双语学习软件的设计思想及体系结构,阐述了学习系统的各个模块的主要功能. 相似文献
3.
5.
在线学习,为什么会火 总被引:2,自引:0,他引:2
互联网以一种不可思议的速度改变着我们的工作、生活、娱乐和学习。不知不觉中,人我们已经步入一个e化的世界——e-mail、e-cash、e-business等等,当然也包括引发教育领域新革命的e-learning(在线学习)。然而,随着互联网热潮的逐渐退去,是否意味着已经兴起的在线学习只是昙花一现呢?今年1月号的美国《企业家》杂志发表了《2003年全球什么最火》一,列举了11个今年最火的商业领域,其中排在首位的便是——在线学习。 相似文献
6.
近年来,深度强化学习(deep reinforcement learning, DRL)已经在诸多序贯决策任务中取得瞩目成功,但当前,深度强化学习的成功很大程度依赖于海量的学习数据与计算资源,低劣的样本效率和策略通用性是制约其进一步发展的关键因素.元强化学习(meta-reinforcementlearning,Meta-RL)致力于以更小的样本量适应更广泛的任务,其研究有望缓解上述限制从而推进强化学习领域发展.以元强化学习工作的研究对象与适用场景为脉络,对元强化学习领域的研究进展进行了全面梳理:首先,对深度强化学习、元学习背景做基本介绍;然后,对元强化学习作形式化定义及常见的场景设置总结,并从元强化学习研究成果的适用范围角度展开介绍元强化学习的现有研究进展;最后,分析了元强化学习领域的研究挑战与发展前景. 相似文献
7.
所谓网络学习,就是指通过计算机网络进行的一种学习活动。在现今的时代,随着计算机和网络技术的普及,尤其是一些学习网站的建立并使用,使网络学习走出最初的专家口中的概念阶段,进入了学 相似文献
8.
9.
e-Learning的学习过程管理的研究 总被引:1,自引:0,他引:1
吴兆斌 《中国信息技术教育》2009,(18):94-94
基于当前网络学习平台中学习过程管理容易被忽略的现状,本文分析学习过程管理中存在的问题,提出重视学习过程管理的必要性,并探讨了学习过程管理系统的构建及应用. 相似文献
10.
结合强化学习技术讨论了单移动Agent学习的过程,然后扩展到多移动Agent学习领域,提出一个多移动Agent学习算法MMAL(MultiMobileAgentLearning)。算法充分考虑了移动Agent学习的特点,使得移动Agent能够在不确定和有冲突目标的上下文中进行决策,解决在学习过程中Agent对移动时机的选择,并且能够大大降低计算代价。目的是使Agent能在随机动态的环境中进行自主、协作的学习。最后,通过仿真试验表明这种学习算法是一种高效、快速的学习方法。 相似文献