首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 234 毫秒
1.
为了帮助协商Agent选择最优行动实现其最终目标,提出基于贝叶斯分类的增强学习协商策略。在协商过程中,协商Agent根据对手历史信息,利用贝叶斯分类确定对手类型,并及时动态地调整协商Agent对对手的信念。协商Agen、通过不断修正对对手的信念,来加快协商解的收敛并获得更优的协商解。最后通过实验验证了策略的有效性和可用性。  相似文献   

2.
基于学习的多Agent多议题协商优化研究   总被引:1,自引:0,他引:1  
以买方Agent的观点,对从交易平台上获得的卖方Agent的历史协商信息进行分析,并根据其特点做初步过滤。在此基础上,针对现有协商模型中存在的问题,提出了一个Agent协商对手选择算法和相应的交互机制,并验证了其可行性。该算法可用于Agent协商开始前协商对手的选择和初始信念的更新,对Agent在协商中策略的选择和执行具有指导作用,能有效提高Agent在协商中的效用及效率。  相似文献   

3.
协商Agent的历史学习算法研究   总被引:5,自引:2,他引:3  
文章以买方Agent的观点对交易平台上获得的对方Agent历史协商信息进行分析,并根据其特点做初步过滤。在此基础上,该文针对现有协商模型中存在的问题,提出了一个Agent协商历史学习算法,并实验说明了其可行性。该算法可用于Agent协商前初始信念的创建,对Agent在协商中策略的选择、执行具有指导作用。  相似文献   

4.
秦子鹰  周南  赵冬梅 《微计算机信息》2007,23(24):137-138,88
该文提出了一个针对轿车市场中交易协商的双边多议题自动协商模型,该模型具有如下特点:用基于效用的相似度比较法实现Agent智能搜索;模型采用学习机制包括历史学习和Q-学习,历史学习机制用于Agent协商前初始信念的创建,对Agent在协商中策略的选择、执行具有指导作用。Q-学习机制用于生成协商提议,使得Agent能够在半竞争、信息不完全和不确定以及存在最大协商时间的情况下,更为有效地完成多议题协商。  相似文献   

5.
在Multi-Agent系统(MAS)中,每一个Agent都有不同的目标。通常只拥有对方的不完全信息。Agent需要具有解决在实现各自目标过程中所产生的各种矛盾的能力。协商是解决这些矛盾的一种有效途径。本文提出了一个基于Bayesian学习的协商模型NMBL:在每一轮协商中,Agent通过Bayesian学习获取协商对手的信息,更新对协商对手的信念,然后根据基于冲突点和不妥协度的协商策略提出下一轮的协商提议。NMBL把整个协商过程看成一个动态的交互过程,体现了Multi-Agent系统的动态特性,同时NMBL具有较强的学习能力。试验证明,该模型具有较好的协商性能。  相似文献   

6.
根据多Agent协商问题的交互特点,引入SVM(Support Vector Machine)分类方法对Agent的协商历史信息进行学习,从Agent的协商历史信息中提取样本来训练SVM,结合模拟协商过程和己方的决策信息,预测与特定伙伴协商时可能出现的结果以及相应的协商收益,根据Agent的自利性原则,选择最合适的协商伙伴.最后,通过仿真实验验证了所提出方法的有效性和优越性.  相似文献   

7.
基于贝叶斯的多议题协商优化   总被引:1,自引:1,他引:0  
在限时条件下的Agent之间的多议题协商中,虽然最差的结果是没有达成协定,而达成了一个使自己潜在利益受损的协定未必就是好的选择。在很多情况下,由于推理策略和交互机制的不完善使得Agent个体失去自己应得的利益。论文使用贝叶斯方法对协商对手进行预测,尽量使自己的初始信念准确反映对手的意识形态;并在此基础之上提出了一个优化的协商交互模型。在此模型中,Agent个体充分利用自己的预测结果,在协商成功的基础上获得尽可能多的利益。  相似文献   

8.
一种AGENT任务求解联盟形成策略   总被引:9,自引:0,他引:9  
Agent联盟是一组平等的、协作的、共同承担任务的Agent的集合.联盟的形成往往需要较大的通信开销和计算工作量.本文提出一种Agent形成联盟的策略,该策略在系统运行的初始阶段,保证任务分配的优化解.而在随后的运行中基于成功合作者集形成Agent联盟.该策略保证在接近任务分配优化解的情况下,有效减少系统中的可能联盟数以及联盟形成过程中的通信开销和计算量,避免联盟形成过程中的盲目性,节省协商时间提高协商效率.  相似文献   

9.
在多智能体系统中,协商是Agent交互的主要形式.用形式化方法构建了基于线性时序逻辑的协商推理模型,该模型用线性时序逻辑描述在协商过程中Agent所处环境,自身能力、权力、知识、思维等随时间的变化,以及在系统运行时Agent采取异步行为.进一步完善了多Agent系统中自主的协商机制.  相似文献   

10.
文中提出了一种预测协商中Agent行为的学习机制,该机制的基础是仅使用协商交往中对方的历史响应进行非线性回归分析。自动协商中对方Agent的行为由其决策函数表示的策略决定。先通过一系列的模拟得到对方在采用各种策略和参数配置的响应,然后总结提取了估计对方策略的启发性知识,最后把此知识应用到实验性的在线协商中进行测试。结果表明使用这些知识能够取得比现有决策函数策略更好的结果。该学习机制可以在线使用,也不需要有关于对方的过去知识,在双方不了解或很少了解的开放式系统中尤为有效。  相似文献   

11.
基于增强学习的代理谈判模型   总被引:2,自引:0,他引:2  
张化祥  黄上腾 《计算机工程》2004,30(10):137-139
利用增强学习的Q-leanling理论,构造了一个基于时间信念、价格信念和状态期望Q值的代理谈判模型。将代理交互报价的过程看成代理选择报价行动,实现状态的迁移,可以计算出代理在不同状态采取行动的Q值。代理可以通过修改信念函数及时问贴现率来调整报价。该文实现了谈判模型的报价算法,并从理论和实验数据两方面进行了分析比较。  相似文献   

12.
王黎明  黄厚宽 《软件学报》2005,16(11):1920-1928
基于假设推理(abduction-based)的推测计算(speculative computation)是在资源信息不能及时到达时,利用缺省假设进行计算的过程.在计算过程中,如果应答和信念不一致,则主Agent将修正它的信念.为了实现目标,在有限时间内使推测计算的结果更精确,主Agent要通过协商获得尽可能多的实际信息,协商是降低决策风险的主要途径.在介绍假设推理和推测计算的基本原理的基础上,提出了基于时间约束的推测计算扩展框架、基于时间约束的进一步协商框架和基于信念修正的协商算法,并将进一步协商框架和协商算法嵌入到推测计算的过程中,在协商过程中赋予主Agent更强的信念修正能力.最后,在货物运输领域的实验中,证实了基于信念修正的推测计算的有效性.  相似文献   

13.
针对多机器人协商中缺少心智状态与实际任务执行能力、通信带宽拥挤导致的低实时性以及从协商历史中缺乏快速学习等问题,提出一种多移动机器人任务协商模型。首先,阐述了机器人基本运动形态;其次,为多机器人协商定义了基于π演算的心智状态(信念、目标、意图、知识更新等)与能力状态(协作、能力判断、任务分配等);再次,构建了多机器人协商模型,研究了协商周期、协商任务、协商效用估计、协商分配协议、学习机制等。最后在机器人足球比赛平台上验证了方法的有效性。  相似文献   

14.
BDI模型信念特性研究   总被引:6,自引:0,他引:6  
Agent计算的典型模型是BDI(belief,desire,intention),信念是Agent计算的重要属性.把信念拓展为知识性信念和可实现信念.Agent的知识性信念是指Agent当前具有或掌握的知识,具有知识的进化和继承特性.Agent的可实现信念是指当前不成立而在将来会成立的事情,是Agent被意识到的个性倾向和目标.用非标准世界的模态逻辑为形式化工具描述两种信念,将可能世界的可达关系作为认识的不同阶段和达到可实现信念的不同阶段,避免了“逻辑全知问题”和逻辑蕴涵的副作用问题.可实现信念满足KD公理,知识性信念满足KDT4公理.两种信念适合描述Agent的意识状态和意识模型.  相似文献   

15.
Supply chain is a complex logistics network, consists of suppliers, manufacturers, warehouses, distribution centers, retailers and customers. In general, the number of firms in each supply chain tier is more than one. Thus, the supply–demand relationship of two adjacent tiers in supply chain is the many-to-many type. Most of supplier selection processes are based on bidding and negotiation mechanism. Due to the diversity of intellectual backgrounds of the negotiating parties, competitive nature, many variables involved in supply–demand relationship, complex interactions and inadequate negotiation knowledge of project participants, the supplier negotiation process is sophisticated. This paper intends to develop the many-to-many supplier negotiation process, design the interactive and competitive bidding strategies of both-side parties, and conduct experimental simulations to investigate how the negotiation efficiency influenced by the varying bidding strategies of a considered demander. The purpose of this paper is to explore the relationships between a demander’s bidding strategies and negotiation efficiency under different order and competitive conditions. The explorative results will be the decision support for assisting a demander to determine the proper bidding strategy in many-to-many supplier negotiation process.  相似文献   

16.
This research proposes an off-line learning method targeted for systematically constructing single-issue negotiation strategies in electronic commerce. Our research is motivated by the following fact: evidence from both theoretical analysis and observations of human interaction shows that if decision makers have a prior knowledge on the behaviors of opponents, the overall payoffs would increase. Given past negotiation data set, a competitive learning and a variant of hierarchical clustering model are applied to extract the negotiation strategies. A negotiation strategy is a chain of the pairs consisting of (buyer’s offer, seller’s counteroffer). An agent-based simulation convinced us that the proposed method is more effective than human negotiation in terms of the ratio of negotiation agreement and resulting payoffs.  相似文献   

17.
基于多议题协商的贝叶斯学习   总被引:2,自引:0,他引:2  
王娟  柴玉梅 《微机发展》2006,16(2):154-156
随着Internet的日益完善和电子商务的普及,如何快速、高效地进行agent协商学习是必须面对和解决的一个重要问题。文中从买方agent的观点出发,在协商过程中采用贝叶斯学习机制进行在线更新对方agent的信念,从而缩短了协商时间,提高了协商效率,并实验说明了其可行性。  相似文献   

18.
基于增强学习的多agent自动协商研究   总被引:2,自引:1,他引:2  
该文通过对协商协议的引入,对提议形式、协商流程的分析,结合多属性效用理论和连续决策过程,提出了一个开放的、动态的、支持学习机制的形式化多问题自动协商模型。并在模型的基础上分别对评估提议、更新信念、生成提议等协商过程作了详细描述;对传统Q学习进行了扩充,设计了基于agent的当前信念和最近探索盈余的动态Q学习算法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号