首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 437 毫秒
1.
为探究个体与系统状态的演化,构建了个体行为策略与网络结构的演化模型,探讨个体在利他激励机制下对合作演化的影响。在该模型中,个体首先通过对其他个体的帮助获得一定的额外互惠收益,并通过个体混合收益累计个体收益与帮助其他个体获得额外收益的加权,以此来激励个体合作。然后在博弈过程中,通过个体混合收益取代费米函数中的个体累计收益用于促进个体选择利他合作策略,从而促进整个群体的总收益与合作水平。蒙特卡罗仿真实验结果表明,个体在利他激励机制下更愿意帮助其他个体。在不同网络结构中,小世界网络最能扩散利他激励机制,其系统合作者密度最高。  相似文献   

2.
从移动成本、收益期望与空间博弈的角度,探讨多主体系统的博弈策略演化与系统涌现特征之间的关系。利用空间演化博弈理论,构建了基于个体移动机制的拓扑结构时刻演变的空间演化博弈模型,分析了当主体具有不同的移动成本与收益期望时系统演化的稳定策略,通过分析稳定策略深入探讨系统中合作簇涌现的机理。仿真结果表明,提高移动成本能够最有效地促进系统合作率,同时中等水平的个体收益期望会进一步促进高移动成本的影响效果。  相似文献   

3.
根据绿色住宅分级制度,设定开发商之间的博弈支付矩阵,用演化博弈的分析方法对风险感知下的有限理性开发商群体的策略演化过程进行分析,研究有限理性个体的学习机制,分析个体间学习行为的影响因素,建立种群间动态复制方程;利用动力学仿真的方法对多种群群体演化博弈过程进行模拟与分析。实验结果表明,激励强度越大,群体演化的速度越快,同时绿色住宅激励机制设计应当与绿色住宅分级制度相结合,实施有差别的激励政策,才能更好地实现激励目标。  相似文献   

4.
针对规则格子上的节点的自私行为不能有效抑制的问题,提出一个结合个体移动和噪声因素的演化囚徒困境模型。该模型结合ALLC、ALLD、TFT和TF2T四种策略来分析个体移动和噪声两个因素分别和共同对演化博弈中合作行为的影响。模型中的博弈者根据收益差异,可以移动到比当前位置收益高的邻居域的空位置,并且在反复博弈过程学习、模仿,不断调整博弈策略,提高博弈所得,最后达到进化稳定状态。最后在Matlab平台上进行仿真实验,实验结果表明,该模型能够促使个体合作,并且对个体的欺骗行为具有抑制作用。  相似文献   

5.
在演化博弈论中,合作有利于增加群体收益.目前,大量的研究工作都在关注合作水平的提高,但忽视了理论与实际的相关性,同时策略更新时间仅限于一个点上的收益.为此,引入完全同步、相对同步、高斯异步、指数异步4种观察机制模型,考虑智能体观察期内所获得的平均收益.随后,采用蒙特卡洛方法进行实验仿真,并分析各观察机制对囚徒困境博弈合作水平的影响.结果表明:在4种模型中都存在观察时间阈值,此时合作水平将达到峰值;最高合作水平在指数异步模型中实现;高斯异步模型中,合作水平与方差成正相关;智能体间的异质性也对合作产生积极影响.这项研究有助于打破传统研究收益的局限,促进合作水平的提高.仿真实验结果为支持社会群体合作提供了一定的理论依据.  相似文献   

6.
在一些由突发性事件所引发的群体性暴力活动中,群体行为的失稳和失控是人群从聚集状态向群体性暴力行为转化的一个重要环节.依据突发性群体事件的相关社会学理论,总结了群体性暴力活动形成和发展的三个主要动力性因素一群体愤怒、谣言传播和个体之间的行为模仿,并在此基础上定义了群体中主体的愤怒情绪生成机制、谣言传播机制和不同类型主体之间的博弈机制等行为特征,利用复杂适应系统建模工具构建了群体暴力活动过渡过程的多主体仿真模型.由于模型能够描述人群在聚集状态下的行为失稳过程,从而有利于从定量和定性的角度研究群体规模效应及处置策略等因素对群体异常行为的影响.  相似文献   

7.
针对囚徒困境博弈中收益矩阵参数无法动态更新的问题,提出一个带惩罚因子的囚徒困境博弈模型。该模型中的个体可以根据自身的策略,动态修改收益矩阵中的参数,在每轮博弈之后个体根据邻居收益更新自己的策略。仿真结果表明,惩罚因子可以有效地促进合作策略的涌现,另外发现,合作策略的涌现不仅与惩罚因子有关,而且与网络个体的初始策略有关。当社团内部的个体采取相同策略,社团之间采取不同策略时,更有利于合作策略的涌现。最后,惩罚因子还可以提高参与者的平均收益。  相似文献   

8.
研究情绪感染对于群体情境中个体情绪变化、行为选择与决策的研究有着十分重要的意义.为了使虚拟个体在群体环境中行为更真实可信,提出以社会心理学基本理论为研究基础,采用群体环境中个体情绪模型的构建方法.依据情绪感染机制的研究成果,从群体环境中人员个性、个体关注度、群体规模三方面反映群体环境中个体情绪的变化过程,提出了个体情绪强度、情绪感染程度及情绪衰减的计算方法.通过仿真分析,表明所提出的模型是合理的,在适用范围上相比较于其它模型更加广泛.  相似文献   

9.
针对虚实互动网络环境下的双群体演化博弈问题,首先给出了一般博弈模型并进行了复制动态分析;然后,建立了双同质群体的多智能体仿真模型,并将仿真结果与复制动态分析和单同质群体进行了对比;最后,从策略更新时间、网络结构、学习机制三方面提出了双群体的异质演化机制。仿真结果表明,不同演化博弈机制下的演化稳定策略基本一致,但演化稳定策略的收敛速度及鞍点取值不同,应用时要根据实际问题的异质特征来构建恰当的博弈演化机制。  相似文献   

10.
为了研究信号传递对合作行为演化的影响,利用Repast仿真软件建立合作行为演化模型,根据信号和策略将个体分为利他者、排外者、谄媚者和背叛者,研究信号对合作水平的影响及机制.仿真结果表明,信号是影响合作水平的重要因素,演化过程中发出相同信号的个体形成团簇,发出不同信号的个体相互制约,并且合作水平随着b值的增大而降低.与无信号博弈相比,有信号条件下合作水平明显提高.所得结果对于研究复杂系统中合作行为演化具有一定的指导意义.  相似文献   

11.
基于Q学习的DDoS攻防博弈模型研究   总被引:1,自引:0,他引:1  
史云放  武东英  刘胜利  高翔 《计算机科学》2014,41(11):203-207,226
新形势下的DDoS攻防博弈过程和以往不同,因此利用现有的方法无法有效地评估量化攻防双方的收益以及动态调整博弈策略以实现收益最大化。针对这一问题,设计了一种基于Q学习的DDoS攻防博弈模型,并在此基础上提出了模型算法。首先,通过网络熵评估量化方法计算攻防双方收益;其次,利用矩阵博弈研究单个DDoS攻击阶段的攻防博弈过程;最后,将Q学习引入博弈过程,提出了模型算法,用以根据学习效果动态调整攻防策略从而实现收益最大化。实验结果表明,采用模型算法的防御方能够获得更高的收益,从而证明了算法的可用性和有效性。  相似文献   

12.
Ad Hoc网络中基于惩罚机制的激励合作转发模型   总被引:1,自引:0,他引:1  
由于Ad hoc网络中的节点受到自身处理能力、存储空间和电池能量等各种资源的限制,节点为了节省自身的宝贵资源经常会表现出自私性,因此激励自私节点之间合作转发成为Ad hoe网络重要的研究内容.为此,结合重复博弈理论的思想,首先建立邻居节点之间的单阶段博弈模型,得到对应的支付策略,并对该模型进行延伸,建立了无限重复博弈模...  相似文献   

13.
根据进化博弈的观点,提出一种资源共享型P2P网络博弈激励模型。对P2P网络进行描述,并对节点的行为进行量化分析,建立节点资源访问的概率模型,给出共享型P2P网络中的个体模拟动态方程。在随机博弈收益矩阵的基础上,通过调整相关参数引导P2P网络向动态平衡的状态演化。仿真实验结果验证了该模型的可行性和灵活性。  相似文献   

14.
王乐  毛剑琳  诸浩富  郭宁 《计算机科学》2016,43(9):146-151, 164
考虑到存在无线信道差错,针对p-坚持CSMA网络的非合作系统行为,建立了p-坚持CSMA演化博弈模型,推导了唯一的演化稳定策略,以饱和吞吐量最大、平均能耗最小为目标求解了最优演化稳定策略。然后,进一步研究了收益时延、成功收益以及比特差错概率对最优演化稳定过程的影响。数值仿真结果表明,当比特差错概率一定、收益时延较小时,选择合适的成本和收益,使多路访问博弈在最优传输概率处演化稳定,可获得一个稳定且性能最优的p-坚持CSMA网络。  相似文献   

15.
This study develops and tests an integrated model of how three psychological variables—presence, flow, and character identification—contribute to interest in learning and empathy with people from other cultures through a simulation game. U.S. college students played one of two roles (an American journalist or Haitian survivor) in the game that dealt with the aftermath of the 2010 Haiti earthquake. Presence was a powerful predictor of flow, character identification, and empathy felt during the games. Furthermore, empathy experienced by game play significantly predicted interest in learning more about the game topics. Flow and identification made secondary contributions to learning outcomes, with flow mediating the effect of presence on males’ empathy and identification contributing to females’ interest in learning. While the proposed model was generally successful at predicting outcomes, it did a better job of accounting for the experience of participants who played a role rooted in their own culture (the journalist) than in a different culture (the survivor), and for female than male players. Our results suggest that serious game designers should prioritize inducing empathy and immersive presence in players, giving secondary attention to designing for flow and character identification.  相似文献   

16.
智能体的一种个性模型   总被引:1,自引:1,他引:0  
刘箴 《计算机科学》2008,35(12):203-206
模拟人类的思想正变得越来越重要,智能体就是模拟人类行为的重要工具.个性是智能体的一个重要属性,可信的角色不仅要具有行为、情绪,而且也要具有丰富的个性.建立智能体的个性化模型一直是心理学家和计算机学家的一个热门话题.综述了个性建模的研究现状,提出了一种新的个性建模途径,其目标是建立面向教育游戏的个性模型,并有效地集成行为、情绪、动机和个性.  相似文献   

17.
The Iterated Prisoner’s Dilemma (IPD) game has been commonly used to investigate the cooperation among competitors. However, most previous studies on the IPD focused solely on maximizing players’ average payoffs without considering their risk preferences. By introducing the concept of income stream risk into the IPD game, this paper presents a novel evolutionary IPD model with agents seeking to balance between average payoffs and risks with respect to their own risk attitudes. We build a new IPD model of multiple agents, in which agents interact with one another in the pair-wise IPD game while adapting their risk attitudes according to their received payoffs. Agents become more risk averse after their payoffs exceed their aspirations, or become more risk seeking after their payoffs fall short of their aspirations. The aspiration levels of agents are determined based on their historical self-payoff information or the payoff information of the agent population. Simulations are conducted to investigate the emergence of cooperation under these two comparison methods. Results indicate that agents can sustain a highly cooperative equilibrium when they consider only their own historical payoffs as aspirations (called historical comparison) in adjusting their risk attitudes. This holds true even for the IPD with a short game encounter, for which cooperation was previously demonstrated difficult. However, when agents evaluate their payoffs in comparison with the population average payoff (called social comparison), those agents with payoffs below the population average tend to be dissatisfied with the game outcomes. This dissatisfaction will induce more risk-seeking behavior of agents in the IPD game, which will constitute a strong deterrent to the emergence of mutual cooperation in the population.  相似文献   

18.
针对无线传感器网络中耗能不均问题,以及可再生能源节点在农田无线传感器网络中应用的具体情况,将博弈理论引入无线传感器网络能耗问题研究中,建立了基于博弈理论的节点成簇方法,实现提高可再生能源利用率、均衡非可再生能源节点能耗的目标。方法首先建立簇收益与簇内节点收益评估模型,进行簇收益计算、簇内的两类能量异构节点个体收益的计算。在计算簇收益和节点收益的基础上进行节点成簇博弈,使得成簇方案向收益更高的策略空间进行跳转,最终达到博弈中的均衡状态。仿真实验表明,通过博弈进行无线传感器网络成簇,能够充分利用可再生能源节点能量,降低和均衡非可再生能源节点能耗,最终达到延长网络寿命的目标。  相似文献   

19.
Population learning in dynamic economies with endogenous network formation has been traditionally studied in basic settings where agents face quite simple and predictable strategic situations (e.g. coordination). In this paper, we start instead to explore economies where the payoff landscape is very complicated (rugged). We propose a model where the payoff to any agent changes in an unpredictable way as soon as any small variation in the strategy configuration within its network occurs. We study population learning where agents: (i) are allowed to periodically adjust both the strategy they play in the game and their interaction network; (ii) employ some simple criteria (e.g. statistics such as MIN, MAX, MEAN, etc.) to myopically form expectations about their payoff under alternative strategy and network configurations. Computer simulations show that: (i) allowing for endogenous networks implies higher average payoff as compared to static networks; (ii) populations learn by employing network updating as a “global learning” device, while strategy updating is used to perform “fine tuning”; (iii) the statistics employed to evaluate payoffs strongly affect the efficiency of the system, i.e. convergence to a unique (multiple) steady-state(s); (iv) for some class of statistics (e.g. MIN or MAX), the likelihood of efficient population learning strongly depends on whether agents are change-averse in discriminating between options associated to the same expected payoff.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号