共查询到20条相似文献,搜索用时 534 毫秒
1.
本文针对一类追求系统得益最大化的协作团队的学习问题,基于随机博弈的思想,提出了一种新的多Agent协同强化学习方法。协作团队中的每个Agent通过观察协作相识者的历史行为,依照随机博弈模型预测其行为策略,进而得出最优的联合行为策略。 相似文献
2.
在传统的进化博弈理论中,假设博弈方与另外博弈方之间的交流是平等的,与其所选择的博弈策略无关。文中将此传统框架扩展,用各博弈方所选择的策略决定其之间的交流程度,即交流系数。交流系数的引入使得各博弈方之间的博弈速率不再是统一的,而是与其各自所选择的策略有关,从而使原本线性的适应度函数成为非线性函数,扩展了进化博弈理论的框架。 相似文献
3.
目前国内中国象棋人机博弈方面的研究相对落后。针对这一状况,设计了一个中国象棋博弈系统,本系统实现前台界面、棋盘表示、着法生成、棋局评估、博弈树搜索等必要过程。棋局评估考虚到了棋子的基本值、灵活性、受攻击度、受保护度,棋子位置附加值等。搜索引擎采用Alpha-Beta剪枝法。整个系统功能完备,具有较强的象棋对弈水平,为相关研究提供了较强的借鉴意义和参考价值。 相似文献
4.
5.
叶品星 《计算机工程与设计》2004,(7)
在考虑下棋操作对棋盘影响的局部性后,提出了棋博弈的Δfeature状态估值算法,通过计算博弈树中相邻结点的特征变化来避免在叶结点上扫描整个棋盘,有效地减少了静态估值的时间开销。若棋子影响的局部范围足够小,还可以考虑将局部范围的所有情况列成表,以查表代替棋形匹配。ΔFeature状态估值算法也可以与其它优化博弈树搜索的方法一同使用,达到更好的效果。 相似文献
6.
考虑到现有无人机搜索问题研究中无人机、移动目标仅有一方具有远距离探测能力的设定,已经无法体现出战场环境下双方的博弈关系。针对这一不足,基于stackelberg均衡策略,结合多步预测的思想,提出了stackelberg多步博弈策略,实现了无人机、目标都具有远距离探测能力的博弈搜索。通过建立无人机、目标各自的路径收益函数,使双方能够根据不同时刻的博弈状态选择相对应的函数,实现无人机的动态路径规划。仿真结果表明所提出策略完全适用于该博弈模型,比贪婪策略具有更高的搜索效率,大大提高了目标捕获率。 相似文献
7.
一种博弈树静态估值算法--△Feature状态估值 总被引:1,自引:0,他引:1
叶品星 《计算机工程与设计》2004,25(7):1214-1217
在考虑下棋操作对棋盘影响的局部性后,提出了棋博弈的△feature状态估值算法,通过计算博弈树中相邻结点的特征变化来避免在叶结点上扫描整个棋盘,有效地减少了静态估值的时间开销。若棋子影响的局部范围足够小,还可以考虑将局部范围的所有情况列成表,以查表代替棋形匹配。ΔAFeature状态估值算法也可以与其它优化博弈树搜索的方法一同使用,达到更好的效果。 相似文献
8.
9.
为了更贴近网络实际,针对当前网络攻防信息不均衡和网络对抗动态性的问题,提出了一种具有主动防御功能的信号博弈模型。在不完全信息约束条件下,通过释放不同防御虚假信号,构建了攻防策略博弈树对攻击者和防御者策略进行了建模,并利用网络伪装信号降低攻击策略的成功率;对存在的各类均衡进行了分析,设计了博弈模型求解方法,并在此基础上给出了最优防御策略。最后,通过仿真实验证明了模型的可操作性和有效性,并对实验结果进行了分析和总结。 相似文献
10.
11.
12.
This article presents an A* search algorithm to be applied to path planning in a Chinese chess game, and uses multiple mobile
robots to present the scenario. The mobile robots have a cylindrical shape, and their diameter, height, and weight are 8 cm,
15 cm, and 1.5 kg, respectively. The controller of the mobile robots is a MCS-51 chip. We play the Chinese chess game using
multiple mobile robots according to the evaluation algorithm of the game, and calculate the displacement by the encoder of
a DC servomotor. The A* search algorithm can solve the shortest-path problem for the mobile robots from the starting point
to the target point on the chess board. The simulated results found the shortest path for the mobile robots (chess pieces)
moving to target points from their starting points in a collision-free environment. Finally, we implemented the experimental
results on a Chinese chess board using mobile robots. Users can play the Chinese chess game using the supervising computer
via a wireless RF interface. The scenario of the feedback of the Chinese chess game to the user interface uses an image system. 相似文献
13.
“久”棋是藏族人民的传统棋类游戏,游戏过程分为布局阶段和战斗阶段,布局的质量对弈棋结果影响很大。与围棋博弈智能软件战胜人类高手的情况比较,“久”棋博弈研究几乎空白。为了拓宽机器博弈研究的游戏范围,开发具有较高棋力的“久”棋软件,作者开展了基于棋型的“久”棋计算机博弈研究。通过实地考察,在四川阿坝地区采集了约300局有效的“久”棋对弈数据,提取了常见棋型,分别为棋型命名为三角、三子、二子、对角、四子等。在布局阶段,采用模式匹配算法提高棋型的匹配速度。在布局和战斗阶段,基于棋型,设计了具有优先级别的防守、攻击、连子策略。采用C语言开发了“久”棋博弈软件,该软件具有人人对弈、人机对弈、自动录制棋谱等功能。该软件在2016年四川省阿坝县第七届“体彩杯”藏棋比赛中成功开展了人机对弈,但是棋力有待提高。结果表明,基于棋型的攻防策略能够有效地应用于“久”棋计算机博弈。 相似文献
14.
15.
This paper introduces METAGAMER, the first program designed within the paradigm of Metagame-playing (Metagame). This program plays games in the class of symmetric chess-like games, which includes chess, Chinese chess, checkers, draughts, and Shogi. METAGAMER takes as input the rules of a specific game and analyzes those rules to construct an efficient representation and an evaluation function for that game; they are used by a generic search engine. The strategic analysis performed by METAGAMER relates a set of general knowledge sources to the details of the particular game. Among other properties, this analysis determines the relative value of the different pieces in a given game. Although METAGAMER does not learn from experience, the values resulting from its analysis are qualitatively similar to values used by experts on known games and are sufficient to produce competitive performance the first time METAGAMER plays a new game. Besides being the first Metagame-playing program, this is the first program to have derived useful piece values directly from analysis of the rules of different games. This paper describes the knowledge implemented in METAGAMER, illustrates the piece values METAGAMER derives for chess and checkers, and discusses experiments with METAGAMER on both existing and newly generated games. 相似文献
16.
丈棋游戏是一种新发明的二人对弈数字游戏,该游戏对开发人类智力有很大的帮助。通过分析研究,我们发现丈棋游戏实际上是一个数字组合问题,它很难设计出博弈搜索算法。最后,我们提出了求解丈棋游戏问题的动态规划算法,并用实验验证了算法的有效性。 相似文献
17.
This paper evaluates experimentally a novel strategy for solving a variant of the differential game of target defense in presence of obstacles. The game is widely applied in the areas of military defense for protecting important equipment such as a ship, an aircraft, a moving vehicle, or a sensitive installation from a malicious attacker. The state-of-the-art approaches mostly employ an offline optimization strategy that is only applicable to holonomic robots. Moreover, most of the approaches could not autonomously avoid obstacles or take into account uncertainties. As a consequence, this paper presents an online optimization technique, by designing a trade-off parameter that integrates game theory with the model predictive control, which allows a nonholonomic defender to intercept the attacker while simultaneously defending the target. Simulations under different conditions as well as several indoor laboratory experiments validate the proposed approach. Moreover, performance is compared with a standard model predictive control approach. 相似文献
18.
针对中国象棋机器人系统中棋子定位与识别问题,提出了一种基于最小外接圆二次定位的定位方法和一种旋转差分识别算法。首先,采用Hough圆检测进行粗定位获取棋子区域,并对棋子进行均值二值化处理。随后,对二值化图像进行形态学处理,提取最大面积轮廓,并利用其最小外接圆实现棋子二次精准定位。最后,对二次定位修正后的图像进行旋转差分识别。以直径为15 mm的棋子为测试对象,利用我们研制的象棋机器人采集图像进行测试,结果表明,棋子的定位精度为0.5 mm,平均定位时间为2.6 ms;在保证棋子识别正确率在98%以上的情况下,单个棋子平均全流程运算时间为10 ms,完全满足现有象棋机器人需求。 相似文献
19.
20.
计算机棋类游戏学习中的自对弈学习指仅依赖行棋过程及最终的输赢结果的学习.整个过程中除下棋规则外不预设任何领域知识,也无专家指导.虽然基于极大极小算法、α-β剪枝算法和蒙特卡洛搜索的自对弈学习已经取得了卓越成果,但是目前仍旧缺乏对于学习样例质量评价的针对性研究.因此,本文首次提出了一种自对弈棋局学习样例质量评价方法,该方法采用样本规模综合指标T—使用样例重复度和样例个数的线性组合—来决定学习样例大小.在西洋跳棋上的实验表明,本评价方法可以达到有效控制学习样例规模的目的,在不降低学习效果的前提下大幅降低学习样例产生的计算成本. 相似文献