期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

王云王俊韩伟《山东大学学报(工学版)》2010,40(6):8-11

强化学习的收敛速度随状态-动作空间的维数呈指数增长,因此在涉及大的状态空间时,强化学习算法的收敛速度非常慢以至不能满足应用需求。在许多应用环境中,若智能体之间存在合作关系,借助多个智能体进行分布式学习可以部分解决这一问题。利用进化算法,设计了智能体繁殖、消亡等操作,使得子代智能体能够继承父代智能体在状态空间的方向信息,从而更快地找到状态-动作空间的有效更新。仿真实验表明:算法比已有的强化学习方法具有更高的搜索效率和收敛速度。相似文献

2.

多智能体足球机器人系统的协作控制 总被引：10，自引：1，他引：9

楚要钦李孝安蒲勇《哈尔滨工业大学学报》2004,36(7):911-913

运用多智能体系统的思想,提出了一种新的多智能体系统协作控制模型,介绍了基于此模型设计的足球机器人系统的策略实现方法,通过实例分析了模型及其策略在系统协作控制方面的性能优越性．相似文献

3.

基于混合式多智能体系统的协作多机器人系统研究

周风余李贻斌宋锐马昕肖海荣《山东工业大学学报》2005,35(1):82-87

针对各种先进制造模式对多机器人系统开放性、灵活性的要求，利用智能体(Agent)的思想，综合了集中规划与分布规划的优点，在局域网环境下，设计了用动态集中规划方法构造的混合式MAS(Multi-Agent System)协作多机器人系统．对机器人Agent的结构及各模块的功能进行了重点介绍．该混合式MAS的特点是：可以方便地动态增加或减少Agents；允许存在异构的机器人；并能够根据各Agent的运行状态和工作能力的变化，对任务进行重新分解和分配．系统实验结果表明，该系统较传统的机器人系统具有良好的开放性、灵活性和鲁棒性。相似文献

4.

对抗性多智能体系统中的规划识别方案

王月海洪炳镕《哈尔滨工业大学学报》2004,36(7):862-863,883

针对当前规划识别限于协作多智能体领域的问题,提出了一种适用于对抗环境下智能体的基于Bayesian网络模型的规划识别方案以识别其他智能体的动作目标．研究了机器人足球的几个典型规划,并利用机器人足球比赛仿真系统进行了测试,仿真结果表明该方案有效地增强了智能体间的协作,提高了球队的获胜率。相似文献

5.

基于混合式多智能体系统的协作多机器人系统研究 总被引：2，自引：0，他引：2

周风余李贻斌宋锐马昕肖海荣《山东大学学报(工学版)》2005,35(1):82-87

针对各种先进制造模式对多机器人系统开放性、灵活性的要求 ,利用智能体 (Agent)的思想 ,综合了集中规划与分布规划的优点 ,在局域网环境下 ,设计了用动态集中规划方法构造的混合式MAS (Multi AgentSystem)协作多机器人系统 .对机器人Agent的结构及各模块的功能进行了重点介绍 .该混合式MAS的特点是 :可以方便地动态增加或减少Agents;允许存在异构的机器人 ;并能够根据各Agent的运行状态和工作能力的变化 ,对任务进行重新分解和分配 .系统实验结果表明 ,该系统较传统的机器人系统具有良好的开放性、灵活性和鲁棒性相似文献

6.

基于Q学习的异构多智能体系统最优一致性

程薇燃李金娜《辽宁石油化工大学学报》2022,42(4):59

对有领导者的异构离散多智能体系统的最优一致性问题,提出了一种无模型的基于非策略强化学习的控制协议设计方法。由于异构多智能体系统的状态矩阵不同,其局部邻居误差的动态表达式比较复杂。与现有的多智能体系统分布式控制方案相比,所提算法减少了计算的复杂性。首先,建立由增广变量构造的多智能体系统全局邻居误差动态表达式。其次,通过二次型形式的值函数得到耦合贝尔曼方程和Hamilton?Jacobi?Bellman（HJB）方程。再次,求解耦合HJB方程的最优解,得到多智能体最优一致性的纳什均衡解,并给出纳什均衡证明。从次,基于无模型的非策略Q学习算法,求解多智能体最优一致性的纳什均衡解。最后,利用批判神经网络结构,结合梯度下降法实现了所提出的算法,并通过仿真实例验证了算法的有效性。相似文献

7.

分布式人工智能与多智能体系统的研究与发展 总被引：2，自引：0，他引：2

董斌何博雄钟联炯《西安工业学院学报》2000,20(4):303-307

根据分布式人工智能的概念,讨论了其研究的领域,着重讨论了分布式人工智能中多智能体系统的基本原理及基本问题;对多智能体系统的主要的研究课题：任务分配、通信、协作及一致性等的研究及发展进行了综述;并针对存在的问题,探讨了分布式人工智能的发展趋势。相似文献

8.

企业内组织的多智能体论述

郭鲁 ;苏文明《适用技术之窗》2008,(2):80-81

近年来对企业内组织的研究，仅仅停留在企业内组织的独立职能上，即如何更好的完善该部门职能以便更好的服务于企业。但由于企业内组织部门是由人作为构成要素的，这就注定了这些部门是具有生命体特征的智能性的个体．所以本文就这一现象，引入智能体（Aqent）来对企业内组织进行分析论述，希望能从一个新的层面来探讨企业内组织结构。相似文献

9.

基于行为的分布式多智能体系统 总被引：2，自引：0，他引：2

王海田彦涛崔茂源史之军《吉林大学学报(工学版)》2002,32(1):93-96

提出了一种基于行为的分布式多智能体结构 ,在此基础上设计并建立了一个多自主机器人系统实验平台。允许系统中的各移动机器人分布式通讯、规划和控制。系统仿真和实验结果证明了系统能正确地完成不同的任务相似文献

10.

一种基于划分和集成思想的多智能体强化学习

王云韩伟《南京师范大学学报》2008,8(4):59-62

针对Q学习状态空间非常大,导致收敛速度非常慢的问题,利用智能体在不同样本上分类性能不同,提出了基于样本的学习误差对样本空间进行划分,充分发掘了样本和智能体的匹配关系.以带障碍物的格子世界作为仿真环境,表明该算法提高了在线学习性能. 相似文献

11.

基于事例的足球机器人学习 总被引：4，自引：0，他引：4

张小川纪钢邵桂芳魏娟李祖枢《哈尔滨工业大学学报》2004,36(7):905-907

足球机器入主要是应用训练、比赛中逐渐积累起来的经验知识来比赛,这样足球机器人相当一部分比赛知识是经验型的．为此,论述了基于事例的足球机器入学习的具体方法和模型,并应用于机器人足球比赛中,实验证明,该方法可行、有效．相似文献

12.

机器人足球防守算法研究 总被引：4，自引：0，他引：4

柳长安刘刚刘春阳《哈尔滨工业大学学报》2004,36(7):951-953

为了提高机器人足球的防守成功率,在分析了简单防守不足的基础上,对防守进行了位置的调节,提出了一种改进的双重守门策略和定点守门策略,并在此基础上得出了防守的全策略．仿真模型的测试结果表明,采用以上两种策略后,其球门的“安全率”有很大程度提高．相似文献

13.

Study and application of reinforcement learning based on DAI in cooperative strategy of robot soccer

郭琦张达志杨永田《哈尔滨工业大学学报(英文版)》2009,16(4):513-519

A dynamic cooperation model of multi-agent is established by combining reinforcement learning with distributed artificial intelligence(DAI),in which the concept of individual optimization loses its meaning because of the dependence of repayment on each agent itself and the choice of other agents.Utilizing the idea of DAI,the intellectual unit of each robot and the change of task and environment,each agent can make decisions independently and finish various complicated tasks by communication and reciprocation between each other.The method is superior to other reinforcement learning methods commonly used in the multi-agent system.It can improve the convergence velocity of reinforcement learning,decrease requirements of computer memory,and enhance the capability of computing and logical ratiocinating for agent.The result of a simulated robot soccer match proves that the proposed cooperative strategy is valid. 相似文献

14.

基于模糊评判的机器人足球比赛策略研究

王进戈王强姚进《哈尔滨工业大学学报》2005,37(7):943-946

针对机器人足球比赛环境的动态性和不确定性,提出了一种基于模糊决策算法的决策方法,给出了该算法的应用条件以及算法的实现过程,球队的队形以及机器人队员的角色都能根据现场情况,进行动态切换．该方法不要求建立精确的数学模型,能够考虑多方面因素,实时性高、决策效果好．计算机仿真验证了该算法的可行性和正确性．相似文献

15.

Layered learning of soccer robot based on artificial neural network 总被引：1，自引：0，他引：1

韩学东洪炳熔《哈尔滨工业大学学报(英文版)》2001,8(3)

0　ＩＮＴＲＯＤＵＣＴＩＯＮＲｅｃｅｎｔｌｙ,ｍｕｌｔｉａｇｅｎｔｓｙｓｔｅｍｓｈａｖｅｂｅｃｏｍｅａｌａｒｇｅｆｉｅｌｄｏｆａｒｔｉｆｉｃｉａｌｉｎｔｅｌｌｉｇｅｎｃｅ[1 ] ,Ｇｅｎｅｒａｌｌｙ,ｍｕｌｔｉａｇｅｎｔｓｙｓｔｅｍｉｓｄｅｆｉｎｅｄａｓｔｈｅｓｙｓｔｅｍｃｏｍｐｏｓｅｄｏｆｍｏｒｅｔｈａｎ 2ｒｏｂｏｔｓａｎｄｐｅｒｆｏｒｍｓｔｈｅｔａｓｋｓｂｙｃｏｏｐｅｒａｔｉｏｎ .Ｔｈｅｓｙｓｔｅｍｈａｓｄｉｆｆｅｒｅｎｔｆａｃｔｏｒｓｃｏｍｐａｒｅｄｗｉｔｈｓｉｎｇｌｅｒｏｂｏｔｓｙｓｔｅｍ … 相似文献

16.

基于人工神经网络的强化学习在机器人足球中的应用 总被引：7，自引：1，他引：7

张彦铎闵锋《哈尔滨工业大学学报》2004,36(7):859-861

将人工神经网络与强化学习相结合,提出了基于人工神经网络的强化学习的应用方法,并用该方法解决了机器人足球比赛中踢球机器人的动作选择问题．实验结果表明了该方法的有效性．相似文献

17.

机器人足球比赛中位置控制算法的改进

柳长安耿文学刘春阳《哈尔滨工业大学学报》2005,37(7):899-901

基于FIRA机器人足球比赛11vs11仿真平台,通过建立数学模型分析了Position函数的工作原理,并对此函数进行改进以适应比赛中具体环境．从三个方面进行了改进：实现区域内避障,探测障碍物并根据具体情况避开障碍到达目标点;分析采用不同函数时机器人的运动轨迹,根据具体情况采用相应的轨迹避障或直接到达目标点;按照指定轨迹运动,完成动作规划,实现路径跟踪．仿真平台的实验证明,Position函数三个方面改进都能达到要求,能适应比赛中的设定情况．相似文献

18.

基于行为的机器人足球智能主体系统研究 总被引：2，自引：0，他引：2

李晓磊路飞田国会《哈尔滨工业大学学报》2004,36(7):940-942

给出了机器人足球系统基于行为的智能主体系统的模型结构．将足球机器人的行为分为3个层次,并描述了行为在各层之间的变迁,引入了再励学习机制,使得足球机器人主体具有行为学习和行为评价能力．系统具有简单易行、鲁棒性强、实时性好等特点．相似文献

19.

足球机器人的防守策略设计与分析

刘春阳柳长安吴克河《哈尔滨工业大学学报》2004,36(7):957-959,968

分析了机器人足球比赛中传统的守门员站位方法,提出了射门三角区的概念,并应用该概念分析了垂足站位方法防守失败的原因,根据分析结果提出了角平分线站位方法和中线站位方法两种新的站位方式;守门员防守底线的方法将多维问题线性化,并且对于各种站位方法进行了分析,给出了对于不同运动性能机器人的应用条件以及能量角度的分析比较．相似文献

20.

足球机器人进攻路径及踢球位姿递推算法 总被引：4，自引：0，他引：4

张伟张大志《哈尔滨工业大学学报》2004,36(7):981-982

在动态环境中实时、准确地预测和规划足球机器人进攻路径和踢球位姿难度极大．为此,提出一个简捷递推算法,用于规划足球机器人进攻路径和调整踢球位姿．FIRA SimuroSot仿真比赛的实践证明该算法是行之有效的．相似文献