期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

计算机博弈:人工智能的前沿领域——全国大学生计算机博弈大赛 总被引：1，自引：1，他引：0

王骄徐心和《计算机教育》2012,(7):14-18

<正>1计算机博弈的由来与发展计算机博弈,亦称机器博弈,是ComputerGames的"狭义"翻译[1],即指通过计算机给出着法,与人类选手或另一个计算机进行各种棋类的对弈,例如比赛象棋、西洋跳棋、黑白棋等。近年来,大家又开始研究让计算机进行牌类对相似文献

2.

股海击浪有轻舟

白晨《中国计算机用户》2001,(20)

作为一个资深网民,我的炒股历史己经有五年了。2000年是只“赚指数不赚钱”,道理很简单——庄家的策略改变了。以往庄家的吸货、洗盘、拉高、出货的手法经传媒广为报道,广大股民早已熟知。于是,今年很多庄家改变策略,短线出击。往往不是赚取几十元利润后撤出,而是三、五元利润到手就溜,很多跟风股民尚未清醒就已经被牢牢套住。有时我不由得感叹,无论从时间、精力上考虑,要成为短线高手都是得不偿失。古语说得好,“工欲事其事,必先利其器。”我得先买一个有用的炒股工具,于是一台可以无线互联的掌上电脑便成了我生活中的必需品,这就是摩托罗拉宝典828 。相似文献

3.

市场·家庭大户室

《计算机》1999,(52)

股市中,唯有“量”是骗不了人的.主力虽然持有庞大的资金与广泛的信息渠道,在股市里横行一世,但其优点往往也是缺点:进货容易,出货难,主力的进出是有迹可循的.一般来说,主力的操盘过程分成四大步骤:吸筹、洗盘、拉抬、出货.庄家操盘策略庄家在一波行情的发动,个股题材的挖掘、打压、拉抬及消息的扩散都是有计划有组织有策略的;股市如同战场,庄家与散户,庄家与庄家,多空之间的搏杀,根本目的是在于获利. 相似文献

4.

家庭大户室

《计算机》2000,(53)

庄家建仓策略及图面表现庄家操盘,第一步便是吸筹,即建仓。无论是打压,震仓还是长期横盘,都是为了顺利吸筹,只有吸足了筹码才可能在往后的拉抬中出货赢利。庄家操盘,当然希望人们知道的越少越好。悄悄的吸货,方式隐蔽,如利用利空消息打压吸筹等,其周期一般在半月以上。对于股本太小的股票,如“利好”消息突然来到时,也会迅速建仓,仅需一、二天时间。常见的庄家建仓方式有：１、长时间的横盘吸筹股价长期横盘甚至超过半年,以时间来拖垮散户持股的信心。特点：股价起伏极度疲软,似乎天天都要下跌;但实际上,股价只是在一… 相似文献

5.

博弈树置换表启发式算法研究

下载免费PDF全文

焦尚彬刘丁《计算机工程与应用》2010,46(6):42-45

博弈树搜索对于计算机博弈至关重要。优秀的搜索算法通过搜索较少的节点就可以获得最佳路径,从而提高计算机的博弈水平。论文以中国象棋计算机博弈作为背景,在alpha-beta基本搜索算法上,详细阐述了置换表启发算法的原理和哈希冲突,引进了双层置换表的概念及其替换策略,增强了引擎的搜索效率。实验结果表明了该算法的有效性。相似文献

6.

基于完全信息博弈的"沙漠掘金"游戏策略

曾梓怡张世雄冀成知远李厚彪《计算机应用》2021,41(z2):93-97

为寻求益智类游戏"沙漠掘金"在多人参与下的游戏策略,针对具体的游戏规则进行了深入的分析,分别提出了基于完全信息静态博弈与完全信息动态博弈的游戏策略.首先,通过简化游戏规则将其转变为一个非合作博弈问题.其次,考虑单人游戏中的最优化问题,分析单人游戏的策略并在此基础上采用博弈论的方法对多人游戏的情况进行求解.最后,针对第一关,满足完全信息静态博弈的情况,模拟玩家行动,得出博弈支付矩阵,通过混合策略纳什均衡的方法计算最优策略;针对第二关,满足完全信息动态博弈的情况,构建博弈树并通过逆向递归求解得出最佳的游戏攻略,并分析了多人竞争策略. 相似文献

7.

基于完全信息博弈的"沙漠掘金"游戏策略

曾梓怡张世雄冀成知远李厚彪《计算机应用》2021,41(z2):93-97

为寻求益智类游戏"沙漠掘金"在多人参与下的游戏策略,针对具体的游戏规则进行了深入的分析,分别提出了基于完全信息静态博弈与完全信息动态博弈的游戏策略.首先,通过简化游戏规则将其转变为一个非合作博弈问题.其次,考虑单人游戏中的最优化问题,分析单人游戏的策略并在此基础上采用博弈论的方法对多人游戏的情况进行求解.最后,针对第一关,满足完全信息静态博弈的情况,模拟玩家行动,得出博弈支付矩阵,通过混合策略纳什均衡的方法计算最优策略;针对第二关,满足完全信息动态博弈的情况,构建博弈树并通过逆向递归求解得出最佳的游戏攻略,并分析了多人竞争策略. 相似文献

8.

双人博弈问题中的蒙特卡洛树搜索算法的改进

季辉丁泽军《计算机科学》2018,45(1):140-143

蒙特卡洛树搜索(MCTS)是一种针对决策类博弈游戏,运用蒙特卡洛模拟方法进行评估博弈策略的启发式搜索算法。但是,在面对计算机围棋这种复杂的决策过程时,简单的蒙特卡洛树搜索过程往往由于计算量大,收敛速度非常慢。由于双人博弈游戏中的蒙特卡洛树搜索不能收敛于双人博弈的最佳决策策略,因此提出蒙特卡洛树搜索结合极大极小值算法的改进算法,使得搜索结果不会因为蒙特卡洛方法的随机性而失真。为了进一步提高复杂双人博弈游戏中搜索算法的计算效率,还结合了几种常见的剪枝策略。实验结果说明,所提算法显著改进了蒙特卡洛树搜索的准确性和效率。相似文献

9.

模拟炒股也要打“庄家”

《计算机》2001,(14)

证券市场上一直存在着一批所谓“庄家”，他们利用资金、信息、技术手段等各种优势，从事内幕交易，操纵股价，如今，这些声名狼藉的庄家们已经受到有关部门的查处最终自食其果。眼下各网站的模拟抄股比赛正如火如荼。原以为模拟炒股只是一种游戏，没想到，还是有一小部分人通相似文献

10.

计算机博弈中序贯不完美信息博弈求解研究进展

罗俊仁张万鹏苏炯铭魏婷婷陈璟《控制与决策》2023,38(10):2721-2748

计算机博弈是人工智能的果蝇和通用测试基准.近年来,序贯不完美信息博弈求解一直是计算机博弈研究领域的前沿课题.围绕计算机博弈中不完美信息博弈求解问题展开综述分析.首先,梳理计算机博弈领域标志性突破的里程碑事件,简要介绍4类新评估基准,归纳3种研究范式,提出序贯不完美信息博弈求解研究框架;然后,着重对序贯不完美信息博弈的博弈模型和解概念进行调研,从博弈构建、子博弈和元博弈、解概念以及评估3方面进行简要介绍;接着,围绕离线策略求解,系统梳理算法博弈论、优化理论和博弈学习3大类方法,围绕在线策略求解,系统梳理对手近似式学习、对手判别式适变和对手生成式搜索3大类方法;最后,从环境、智能体(对手)和策略求解3个角度分析面临的挑战,从博弈动力学和策略空间理论、多模态对抗博弈和序贯建模、通用策略学习和离线预训练、对手建模(剥削)和反剥削、临机组队和零样本协调5方面展望未来研究前沿课题.对于当前不完美信息博弈求解问题进行全面概述,期望能够为人工智能和博弈论领域相关研究带来启发. 相似文献

11.

RTS游戏中用户行为的神经网络预测模型

李艳代佳岳佟晓磊王熙照《计算机工程与设计》2012,33(2):740-744

即时战略游戏(简称RTS游戏)中,用户的行为由于游戏自身庞大的决策空间而难以预测.针对这个问题,提出了通过对RTS游戏的对战记录进行分析,建立5种结构的神经网络模型来预测用户行为的方法.模型考虑了不同时间片的状态对于决策行为的影响,设计了单时间片输入和双时间片输入的神经网络,并与基于动态贝叶斯网络的模型进行了比较.实验结果表明,基于单时间片输入的神经网络模型能够更加快速地完成训练过程并达到满意的预测准确度. 相似文献

12.

Goal programming to model human decision making in ultimatum games

Patrick Beullens Nerda Z. Zaibidi Dylan F. Jones 《International Transactions in Operational Research》2012,19(4):599-612

Goal Programming (GP) is applied to modelling the decision making processes in the well‐known Ultimatum Game and some of its variations. The decision model for a player is a Chebychev GP model that balances her individual desires with the mental model she has of the desires of other relevant players. Fairness is modelled as a universal mechanism, allowing players to differ in their belief of what a fair solution should be in any particular game. The model's conceptual framework draws upon elements considered of importance in the field of cognitive neuroscience, and results from the field of psychology are used to further specify the types of goals in the model. Computer simulations of the GP models, testing a number of Ultimatum, Dictator and Double‐Blind Dictator Games, lead to distributions of proposals made and accepted that correspond reasonably well with experimental findings. 相似文献

13.

基于博弈论框架的用户行为决策模型 总被引：1，自引：0，他引：1

下载免费PDF全文

孙锦霞廖福成田立勤冀铁果《计算机工程》2008,34(9):159-161

从风险与安全的角度提出一种新的用户行为决策模型,将服务提供者和用户作为非合作博弈的对立方,在不完全信息静态博弈的基础上研究博弈参与者之间的交互行为。从博弈参与者的相互依赖的行动选择角度建立博弈模型,求出最优混合策略。在此基础上,服务提供者从最大化自己利益的角度作出决策。相似文献

14.

棋牌游戏与事件对策 总被引：2，自引：0，他引：2

下载免费PDF全文

徐心和郑新颖《控制与决策》2007,22(7):787-790

博弈的原意便是下棋，博弈论的概念也源于棋类游戏．而博弈论的现有成果还难以描述和处理棋牌游戏这一类复杂的动态过程．为此．在分析棋牌游戏特点的基础上．指出它们属于离散事件的动态过程；在阐述离散事件动态系统（DEDS）特点与方法的基础上，应用DEDS的有关理论为象棋博弈过程建模，并提出了事件对策的概念与形式框架．探讨了事件对策理论在战争模拟中的应用，为迅速发展的机器博弈研究创造了良好的理论条件．相似文献

15.

Decision making in dynamic stochastic Cournot games

Hamed Kebriaei Ashkan Rahimi-Kian 《Mathematics and computers in simulation》2011,81(6):1202-1217

In this paper, the Cournot competition is modeled as a stochastic dynamic game. In the proposed model, a stochastic market price function and stochastic dynamic decision functions of the rivals are considered. Since the optimal decision of a player needs the estimation of the unknown parameters of the market and rivals’ decisions, a combined estimation-optimization algorithm for decision making is proposed. The history of the rivals’ output quantities (supplies) and the market clearing price (MCP) are the only available information to the players. The convergence of the algorithm (for both estimation and decision making processes) is discussed. In addition, the stability conditions of the equilibrium points are analyzed using the converse Lyapunov theorem. Through the case studies, which are performed based on the California Independent System Operator (CA-ISO) historical public data, the theoretical results and the applicability of the proposed method are verified. Moreover, a comparative study among the agents using the proposed method, naïve expectation and adaptive expectation in the market is performed to show the effectiveness and applicability of the proposed method. 相似文献

16.

一种基于Q学习的有限理性博弈模型及其应用 总被引：1，自引：0，他引：1

陈荣钦 ;林君焕 ;陈月芬《系统仿真技术》2014,(3):203-210

传统博弈理论模型建立在人的完全理性基础之上,难以切合实际。有限理性博弈则能够很好地描述实际问题。有限理性的博弈者参与到不完全信息博弈中,对博弈的规则、结构以及对手等博弈信息有一个逐渐适应和了解的过程,因此博弈应是动态进化的模型。针对这一问题,提出了一种基于Q学习算法的不完全信息博弈模型,根据Littman的最大最小原则建立了多指标体系下的策略选择概率分布;构建了Q学习与博弈融合的数学模型,使用Q学习机制来实现博弈模型的动态进化;最后将模型应用于两人追逐的仿真实验,结果表明所提出的模型能够很好地再现追逐情景。相似文献

17.

基于对策论的团队计算机生成角色任务分配方法

郑延斌陶雪丽《计算机应用》2013,33(3):793-795

针对带有时间约束的、可以动态加入到环境中的复杂任务,建立了一种基于对策论的任务分配模型,并给出了一种任务分配方法。该方法中计算机生成角色(CGA)根据自身掌握的局部信息进行行为选择,并使用虚拟行动方法确保CGA快速学习到一个严格纯策略Nash平衡。仿真实验结果表明该方法是合理的,能够有效地解决动态任务的分配问题。相似文献

18.

Model-based reinforcement learning for partially observable games with sampling-based state estimation

Fujita H Ishii S 《Neural computation》2007,19(11):3051-3087

Games constitute a challenging domain of reinforcement learning (RL) for acquiring strategies because many of them include multiple players and many unobservable variables in a large state space. The difficulty of solving such realistic multiagent problems with partial observability arises mainly from the fact that the computational cost for the estimation and prediction in the whole state space, including unobservable variables, is too heavy. To overcome this intractability and enable an agent to learn in an unknown environment, an effective approximation method is required with explicit learning of the environmental model. We present a model-based RL scheme for large-scale multiagent problems with partial observability and apply it to a card game, hearts. This game is a well-defined example of an imperfect information game and can be approximately formulated as a partially observable Markov decision process (POMDP) for a single learning agent. To reduce the computational cost, we use a sampling technique in which the heavy integration required for the estimation and prediction can be approximated by a plausible number of samples. Computer simulation results show that our method is effective in solving such a difficult, partially observable multiagent problem. 相似文献

19.

复杂网络中基于QRD的主动防御决策方法研究

金辉张红旗张传富胡浩《信息网络安全》2020,(5):72-82

针对未知网络攻防场景下,信息不公开导致最优防御策略难以准确选取的问题。通过对不完全信息下的网络攻防博弈进行分析,文章首先构建具有探索机制的攻防演化博弈模型;然后基于Boltzmann探索的Q-learning复制动态方程构建攻防决策动态演化方程;最后通过求解演化稳定均衡给出最优防御策略选取方法,并刻画攻防策略的演化轨迹。仿真实验结果表明,对于小规模局域网,在探索程度参数取10附近时,生成的最优防御策略具有较好的可解释性和稳定性,能够使得防御主体获取最大防御收益。相似文献

20.

基于演化博弈的蜜罐有效性机理证明

李阳赵俊楠石乐义《计算机技术与发展》2020,(4):105-109

借鉴自然界生物演变进化过程中复制动态的思想,基于演化博弈对蜜罐技术的有效性机理进行研究,分析网络中攻防双方如何根据自身行动策略及支付函数进行演变,从而使博弈收益最大化。演化博弈从一种全新角度诠释了博弈均衡概念,不再是完全理性也非完全信息,为纳什均衡和均衡战略的选择演绎出新方法。演化博弈过程中,防御方是包括普通服务和蜜罐的混合系统,其对手是访问混合系统的恶意攻击者,双方构成了博弈参与者。混合网络系统可看作一个生态系统,而来访者则只有攻击者一个种群;混合系统持续为来访者提供服务,攻击者可选择访问或不访问。论文基于复制动态方程推理计算满足演化稳定策略的均衡点,并利用Matlab平台仿真验证博弈双方的策略演变趋势,从而在理论上证明了蜜罐技术的有效性机理。相似文献