首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 78 毫秒
1.
有限理性参与者之间的博弈问题是人们十分关注的研究项目.目前已提出了一些博弈学习模型,但都存在一定的局限性,本文给出了博弈学习的一个改进方法,建立了新的博弈学习模型.计算机实验表明,新的博弈学习方法的实用性和有效性有了很大的提高.  相似文献   

2.
有限理性下的企业合作竞争的进化博弈分析   总被引:9,自引:0,他引:9  
在有限理性的条件下,应用进化博弈论中的模仿者动态模型来分析企业合作竞争博弈的演化,用进化稳定策略来描述合作竞争博弈的长期演化趋势。并分别讨论了对称和非对称的合作竞争博弈的进化均衡与稳定性。最后,指出确定性模仿者动态模型的不足,以及当今随机动态系统理论的发展。  相似文献   

3.
一种基于Q学习的有限理性博弈模型及其应用   总被引:1,自引:0,他引:1  
传统博弈理论模型建立在人的完全理性基础之上,难以切合实际。有限理性博弈则能够很好地描述实际问题。有限理性的博弈者参与到不完全信息博弈中,对博弈的规则、结构以及对手等博弈信息有一个逐渐适应和了解的过程,因此博弈应是动态进化的模型。针对这一问题,提出了一种基于Q学习算法的不完全信息博弈模型,根据Littman的最大最小原则建立了多指标体系下的策略选择概率分布;构建了Q学习与博弈融合的数学模型,使用Q学习机制来实现博弈模型的动态进化;最后将模型应用于两人追逐的仿真实验,结果表明所提出的模型能够很好地再现追逐情景。  相似文献   

4.
有限理性与信息处理模型研究综述   总被引:6,自引:0,他引:6  
蒋炜  程少川 《控制与决策》1998,13(3):200-205
通过对社会经济现象中决策过程的研究,分析了决策中的理性与公共知识、理性有限性与个人信念之间的关系,并指出决策中的有限理性在经济分析中的作用,进而通过一般信息处理模型框架对有限理性分析建模的方法进行了综述。  相似文献   

5.
具有学习能力的有限理性双寡头竞争分析与混沌控制   总被引:1,自引:0,他引:1  
胡荣  陈圻 《控制与决策》2011,26(1):133-136
利用动力系统的分支理论研究了具有学习能力的有限理性双寡头产量竞争模型,讨论了该模型均衡点的存在性与稳定性,并进行了数值仿真.仿真结果表明,企业产量调整速度的变化对于模型的稳定性有较明显的影响;运用延迟反馈控制法町使陷入混沌的模型重新稳定在Nash均衡状态,混沌控制实施者可从混沌控制中获利.  相似文献   

6.
刘海  彭长根  张弘  任祉静 《计算机科学》2015,42(9):118-126, 143
博弈逻辑ATL和ATEL可以对传统安全协议的公平性、安全性等性质进行分析与验证。但在理性环境中,由于参与者对知识的自利性,ATL和ATEL都不能形式化分析与验证理性安全协议。因此在CEGS中引入效用函数和偏好关系知识,得到新的rCEGS,并在合作模态算子《Γ》中加入行为ACT参数,提出新的可形式化分析理性安全协议的交替时序认知逻辑rATEL-A。然后运用rATEL-A构建两方理性安全协议的形式化模型,并基于rCEGS的等价扩展式博弈,对具体的两方理性交换协议进行形式化分析,结果表明构建的形式化模型可以有效地形式化分析理性安全协议的正确性、理性安全性和理性公平性。  相似文献   

7.
为了让游戏NPC能够学习和模拟玩家在游戏中的策略和行为方式,在基于模型的智能决策方法基础上,结合行为决策理论中的有限理性模型提出了一种新的游戏智能方法.该方法分别从有限理性模型的两个核心原则——有限理性和满意准则来改进过去的方法在感知和决策过程中所面对的问题,从而使得游戏NPC行为决策方式更加人性化.最后,通过在Starcraft平台上与其他方法的对抗性实验来进一步验证该方法的优势.  相似文献   

8.
理性密钥共享体制通过引入惩罚策略使得参与者不会偏离协议,常采用的惩罚是一旦发现有人偏离就立即终止协议.这种惩罚策略有时导致惩罚人自身利益严格受损,从而降低了对被惩罚人的威慑.为了克服这一弱点,本文以扩展博弈为模型分析了理性密钥共享体制.首先给出(2,2)门限的理性密钥共享体制,证明了所给的协议是该博弈的一个序贯均衡,即经过任何历史之后坚持原协议仍然是每一个参与者的最优选择.特别地,在发现有人偏离后,协议所给出的惩罚策略既可以有效惩罚偏离者又能够完全维护惩罚人的利益.这是本文对前人设计的理性密钥共享体制的一个重要改进.然后针对将协议扩展到(t,n)门限情形,实现密钥分发人离线,达到计算的均衡等相关问题给出了一般的解决方案.  相似文献   

9.
利用非线性动力系统的分支理论研究了有限理性双寡头Stackelberg产量竞争模型,讨论了该模型均衡点的存在性与稳定性,并数值仿真出该模型倍岔、混沌等复杂的动力学现象。研究结果表明:产量调整速度的变化对模型的稳定有显著的影响;系统的波动对于双寡头并非都是不利的;领先者的先动优势可使其从某些条件下的系统波动中获利。在此基础上,运用延迟反馈控制法对Stackelberg产量竞争模型的混沌控制进行了解析分析和数值仿真,结果表明选择合适的控制因子可使模型稳定在Nash均衡。  相似文献   

10.
从现实交易者的有限理性角度,描述了基于Agent的股票市场模型,研究设计了带有认知偏误的交易者Agent,分析了多Agent之间的相互关系,指出了心理因素在其中的重要作用。通过对连续双向拍卖交易收敛到竞争均衡过程的分析,发现了与有效市场假设相悖的结果。  相似文献   

11.
有限理性理论认为个体的决策能力是有限的,本文建立元胞自动机(CA)模型研究群体决策中有限理性个体的投票过程,给出了CA的演化规则,模拟了相互邻接的个体问的相互作用,观测到了投票过程的一些微观现象。元胞自动机理论将是推动自然科学和社会科学发展的一个有效工具。  相似文献   

12.
基于博弈论的入侵检测模型   总被引:1,自引:0,他引:1  
入侵检测系统是保障网络动态安全的一个重要组成部分,但现有的入侵检测技术仍然存在着不容忽视的虚警和漏警,如何制订响应决策成了入侵检测系统的一大难题。将博弈论的思想引入入侵检测系统的决策过程中,提出了一个基于博弈论的入侵检测模型及其分析方法,并给出了实验分析。  相似文献   

13.
理性交换协议(REP)因使用了理想化的理性假设,在现实中有可能失效。为解决此协议失效的问题,基于与现实更为接近的有限理性假设(BRH),定义了有限理性公平概念,并首次基于BRH设计了有限理性公平数据交换协议(FDEP-BR)。理论分析表明,与REP相比,FDEP-BR虽然牺牲了一定效率(轮复杂度为O(l*v)),但具有容错性和有限理性公平性,能够抵抗非合作攻击。对FDEP-BR构造自动机模型,并改进经验加权吸引(EWA)学习模型的决策方式,设计了EWA学习决策算法;在此基础上,基于Jade-Repast集成平台对FDEP-BR进行了仿真,仿真结果表明FDEP-BR的均衡状态与预期具有一致性。  相似文献   

14.
In the mainstream top-down approach, money is neutral except with special assumptions. Intending to make money “essential”, random-matching models introduced decentralisation by considering pair-wise transactions. Nevertheless, in both cases top-level equilibrium constrains agents’ behaviour. Instead, here we use a bottom-up approach. In a competitive market, decentralised autonomous agents meet and exchange a commodity for money. Their decisions use minimal information. They are triggered by simple rules founded on a “satisficing” procedure and on a random decision process that simulates bounded rationality. The conclusions are, first, that non-monetary costs are essential to avoid collapse of the economy. Second, mainly “price setters” who are adequately satisfied achieve equilibrium protecting themselves by evolving advantages to avoid competition that is too tough. Third, and the most important conclusion is that money ceases to be neutral as soon as competition arises between individual firms.  相似文献   

15.
张虹  李晓 《计算机科学》2000,27(12):86-88
1 引言对策论的研究是以每个Agent的效用和赢利为基础的,每个Agent都希望能够在协商过程中求得Nash平衡的策略组合,使得那些基于理性假设的Agent均可获得一个稳定并且满意的解。当任何理性Agent达到Nash平衡点后,它们都不会试图离开,这是因为只有Nash平衡点,才能获得较大的赢利。可惜的是,Nash平衡不一定总是存在,或者可能存在多个,在这些情况下,如何寻找满意解,是人们一直试图解决的  相似文献   

16.
Consider an information network with threats called attackers; each attacker uses a probability distribution to choose a node of the network to damage. Opponent to the attackers is a protector entity called defender; the defender scans and cleans from attacks some part of the network (in particular, a link), which it chooses independently using its own probability distribution. Each attacker wishes to maximize the probability of escaping its cleaning by the defender; towards a conflicting objective, the defender aims at maximizing the expected number of attackers it catches. We model this network security scenario as a non-cooperative strategic game on graphs. We are interested in its associated Nash equilibria, where no network entity can unilaterally increase its local objective. We obtain the following results:
•  We obtain an algebraic characterization of (mixed) Nash equilibria.
•  No (non-trivial) instance of the graph-theoretic game has a pure Nash equilibrium. This is an immediate consequence of some covering properties we prove for the supports of the players in all (mixed) Nash equilibria.
•  We coin a natural subclass of mixed Nash equilibria, which we call Matching Nash equilibria, for this graph-theoretic game. Matching Nash equilibria are defined by enriching the necessary covering properties we proved with some additional conditions involving other structural parameters of graphs, such as Independent Sets.
–  We derive a characterization of graphs admitting Matching Nash equilibria. All such graphs have an Expanding Independent Set. The characterization enables a non-deterministic, polynomial time algorithm to compute a Matching Nash equilibrium for any such graph.
–  Bipartite graphs are shown to satisfy the characterization. So, using a polynomial time algorithm to compute a Maximum Matching for a bipartite graph, we obtain, as our main result, a deterministic, polynomial time algorithm to compute a Matching Nash equilibrium for any instance of the game with a bipartite graph.
A preliminary version of this work appeared in the Proceedings of the 16th Annual International Symposium on Algorithms and Computation, X. Deng and D. Du, eds., Lecture Notes in Computer Science, vol. 3827, pp. 288–297, Springer, December 2005. This work has been partially supported by the IST Program of the European Union under contract 001907 ( ), and by research funds at University of Cyprus.  相似文献   

17.
丁晓燕  席裕庚 《计算机仿真》2009,26(10):148-152
多智能体覆盖控制问题是多智能体分布式协作控制的一个重要研究方向,对于要完成给定任务的多智能体系统而言,保持整体的连通性以便信息的共享非常重要。为解决多智能体连通覆盖问题,在非合作博弈的基本模型上,提出了一种完全分布式的控制算法,即每个智能体仅利用通信范围内其他智能体的信息来独立决策自己的行动,使得系统能在基本保持全局连通的同时,实现对周围环境的最大覆盖。在决策每一步的行动时,每个智能体都希望和通信范围内的其他智能体保持尽可能大的距离,但又不能完全孤立,可看作是一个多目标组合优化问题。仿真结果表明了算法的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号