首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 203 毫秒
1.
多智能体运输调度系统协商机制的研究   总被引:1,自引:0,他引:1  
针对大型企业运输调度问题,采用多智能体技术,提出了一个多智能体运输调度系统模型,将汽车资源构造为具有自主能力的汽车智能体,从而提高了系统问题求解的能力,并对系统中多智能体之间的协商机制进行了探讨。  相似文献   

2.
陈道琨  刘芳芳  杨超 《软件学报》2022,33(8):4452-4463
很多强化学习方法较少地考虑决策的安全性,但研究领域和工业应用领域都要求的智能体所做决策是安全的.解决智能体决策安全问题的传统方法主要有改变目标函数、改变智能体的探索过程等,然而这些方法忽略了智能体遭受的损害和成本,因此不能有效地保障决策的安全性.在受限马尔可夫决策过程的基础上,通过对动作空间添加安全约束,设计了安全Sarsa (λ)方法和安全Sarsa方法.在求解过程中,不仅要求智能体得到最大的状态-动作值,还要求其满足安全约束的限制,从而获得安全的最优策略.由于传统的强化学习求解方法不再适用于求解带约束的安全Sarsa (λ)模型和安全Sarsa模型,为在满足约束条件下得到全局最优状态-动作值函数,提出了安全强化学习的求解模型.求解模型基于线性化多维约束,采用拉格朗日乘数法,在保证状态-动作值函数和约束函数具有可微性的前提下,将安全强化学习模型转化为凸模型,避免了在求解过程中陷入局部最优解的问题,提高了算法的求解效率和精确度.同时,给出了算法的可行性证明.最后,实验验证了算法的有效性.  相似文献   

3.
介绍DirectX的组件Direct3D,以DirectX为接口开发虚拟驾驶系统,应用Direct3D技术实现了驾驶模拟视景系统中智能体的运动仿真、智能体三维模型在虚拟场景中的显示变换,应用面向对象技术创建基于Direct3D的车辆智能体类库,应用这些类库在虚拟环境中实现汽车的虚拟驾驶模型。  相似文献   

4.
谢雅  彭军  吴敏 《计算机仿真》2006,23(3):120-122,176
智能体间的协作能够提高多智能体系统的智能度。而规划作为一种重要的问题求解技术,能够有效地实现多智能体间的协作。该文介绍了一种基于协怍的规划模型及此模型的前提、动作和终止条件三要素,通过对特定状态和局部协作的提前规划,有效地实现了多智能体系统中智能体间的协作。通过把此规划模型运用到典型的多智能体系统一机器人足球比赛中,证明了在多智能体系统中应用此规划模型不仅能够提高单个智能体的反应速度,还可以提高整个系统的运行效率。  相似文献   

5.
多智能体分布问题求解复杂度与其组织结构紧密相关,在层次组织中进行多层问题抽象以及子问题并行求解,可以将复杂度为指数规模问题规约为对数规模问题.本文使用基于角色层次组织模型,集成人工智能中已有快速求解算法,提出一种面向仿真的层次式多智能体问题求解算法.算法具有良好的计算复杂度、灵活性与可扩展性,已应用于战场仿真中多智能体的协同.  相似文献   

6.
多配送中心车辆路径规划(multi-depot vehicle routing problem, MDVRP)是现阶段供应链应用较为广泛的问题模型,现有算法多采用启发式方法,其求解速度慢且无法保证解的质量,因此研究快速且有效的求解算法具有重要的学术意义和应用价值.以最小化总车辆路径距离为目标,提出一种基于多智能体深度强化学习的求解模型.首先,定义多配送中心车辆路径问题的多智能体强化学习形式,包括状态、动作、回报以及状态转移函数,使模型能够利用多智能体强化学习训练;然后通过对MDVRP的节点邻居及遮掩机制的定义,基于注意力机制设计由多个智能体网络构成的策略网络模型,并利用策略梯度算法进行训练以获得能够快速求解的模型;接着,利用2-opt局部搜索策略和采样搜索策略改进解的质量;最后,通过对不同规模问题仿真实验以及与其他算法进行对比,验证所提出的多智能体深度强化学习模型及其与搜索策略的结合能够快速获得高质量的解.  相似文献   

7.
针对非线性马尔科夫跳变多智能体系统在有向固定拓扑下的领导跟随一致性问题,为减少智能体间不必要的通信传输,节约网络资源,保证系统性能,提出一种自适应事件触发控制策略.首先,将每一个智能体均视为马尔科夫跳变系统,且马尔科夫链的转移概率部分未知;通过简单的模型转换建立误差系统,将多智能体系统一致性问题转化为误差系统的稳定性问题;在此基础上,构造合适的Lyapunov-Krasovskii泛函并利用Jensen不等式和线性矩阵不等式等技术给出使多智能体系统达到领导跟随一致性的充分条件及控制器设计方法;通过求解线性矩阵不等式可以得到多智能体系统一致性控制器增益矩阵和事件触发参数矩阵;最后,通过数值仿真验证所提出方法的有效性.  相似文献   

8.
针对模型未知的一类离散时间多智能体系统,本文提出了一种Q-learning方法实现多智能体系统的一致性控制.该方法不依赖于系统模型,能够利用系统数据迭代求解出可使给定目标函数最小的控制律,使所有智能体的状态实现一致.通过各个智能体所产生的系统数据,采用策略迭代的方法实时更新求解得到多智能体系统的控制律,并对所提Q-learning方法进行了收敛性和稳定性分析.最后,论文给出了计算机仿真验证了所提方法的有效性.  相似文献   

9.
群智能在多智能体系统中的应用研究进展   总被引:1,自引:1,他引:0  
群智能算法是受群居性昆虫群体的集体行为启发而设计的分布式问题求解方法,将它应用到多智能体系统,旨在提高系统的鲁棒性、灵活性和自适应性。以群智能在多智能体系统中的应用为线索,首先介绍群智能的核心机制,然后从多智能体系统通信机制、协作技术、学习问题及体系结构建立这几个方面总结群智能理论在多智能体系统中的已有工作。最后分析和讨论了群智能方法在多智能体系统应用中存在的问题,并提出今后的工作展望。  相似文献   

10.
致力于解决多智能体系统中的任务分配问题,基于社会生活中的竞争现象提出了一种多智能体竞争模型,同时提出了解决多智能体任务分配的详细算法.文章引入博弈论来研究存在相互外部约束条件下的个体选择问题.为了克服求解纳什均衡点的复杂性,本文采用了一步纳什均衡的方法.仿真结果证明了本模型的合理性和算法的有效性.  相似文献   

11.
依据产品的可配置性,提出基于非二元约束的逻辑产品模型,给出基于动态变量序的一类配置求解算法。采用仿真实验比较各种算法的求解效率,指出各算法在不同配置约束密度下快速求解配置问题时的适用范围。基于逻辑产品模型,依据配置问题实际性质,采用相应配置求解算法,能够更快地生成符合客户要求的产品配置方案。  相似文献   

12.
一个基于模拟退火的多主体模型及其应用   总被引:2,自引:1,他引:2       下载免费PDF全文
近些年,多主体系统的理论及应用得到了人们的广泛关注,并得以迅速发展.研究者提出了很多基于多主体系统理论的模型,用于求解各种问题.AER(Agent-environment-rules)模型正是一个用于求解约束满足问题较为成功的例子.但是,主体的静态策略选择在一定程度上限制了模型的求解性能.将模拟退火算法与多主体系统思想相结合,并赋予主体更为高效的动态策略选择的能力,提出了SAAER模型(simulated annealing based AER model).基于约束满足问题经典实例--N-Queen问题和染色问题的实验表明,改进后的模型较之原模型获得了更高的效率和稳定性.对于N=10000的大规模N-Queen问题,能在200s左右的时间求得精确解.  相似文献   

13.
In this paper, a novel denoising algorithm based on the denoising methods of partial differential equations is presented. The proposed algorithm is obtained by using a stochastic algorithm for combining two denoising methods based on partial differential equations. The model provides a new approach for solving the contradiction in the image restoration. The new hybrid model has more ability to restore the image in terms of peak signal to noise ratio, blind/referenceless image spatial quality evaluator and visual quality, compared with each of denoising methods separately used. Experimental results show that our approach is more efficient in image denoising than the used denoising methods.  相似文献   

14.
成像侦察任务流的航天资源任务规划问题是将有限的航天资源分配给需要侦察的不同目标,最大化满足任务需求.采取了星地一体任务规划思路进行问题建模与求解.提出星地一体虚拟资源聚合模型和算法,并在此基础上,给出了星地一体的虚拟资源冲突检测与消解方法,提出了星地一体任务规划模型的模型分解与组合求解方法,针对分解后的主问题模型给出了一种适应可变冲突约束的遗传算法;针对子问题模型给出了一种基于时间序列排序的任务调度方法,并对上述两种算法进行了设计与实现;最后,结合试验案例进行验证.  相似文献   

15.
This paper compares numerical methods for solving the competitive storage model. Because storage implies a nonnegativity constraint on stocks, the solution methods must be considered carefully. The model is solved using value function iteration and several projection approaches, including parameterised expectations and decision rules approximation. In considering a storage model with convenience yield, in which the inequality constraint is smoothed, perturbation methods are also applied. Parameterised expectations approximation proves to be the most accurate method, whereas perturbation techniques are shown inadequate for solving this highly nonlinear model. The endogenous grid method allows rapid solution if supply is assumed to be inelastic.  相似文献   

16.
贺甫霖  刘磊  吕帅  牛当当  王强 《软件学报》2020,31(2):395-405
模型计数是指求出给定命题公式的模型数,是SAT问题的泛化.模型计数在人工智能领域取得了广泛应用,很多现实问题都可以规约为模型计数进行求解.目前,常用的模型计数求解器主要有Cachet与sharpSAT,它们均采用完备方法且具有高效的求解能力,但其求解效率对模型数不敏感.有理由猜测:当给定问题的模型较少时,不完备算法可能发挥其效率优势而更适合模型计数.局部搜索是求解SAT问题的高效不完备方法,Cai等人提出了格局检测策略,并将其应用到局部搜索方法中,提出了SWcc算法,具有很高的求解效率.对SWcc算法进行扩充,分别得到了迭代法与优化后的增量法两种效率较高的不完备模型计数方法,给出了两种方法的思路和具体实现.最后给出了大量测试样例的实验结果,以验证当给定合取范式的模型较少时,该迭代法与优化后的增量法的求解效率有所提升.  相似文献   

17.
分析了当前高校信息系统集成存在的问题;根据面向服务的框架原理,提出了一种基于SOA的高校信息系统集成模型;阐述了模型内各模块的设计和实现方法。在实际应用中,该系统集成模型在解决业务流程重构和软件复用等问题上显现出一定的优势。  相似文献   

18.
TSK-fuzzy modeling based on /spl epsiv/-insensitive learning   总被引:1,自引:0,他引:1  
In this paper, new learning methods tolerant to imprecision are introduced and applied to fuzzy modeling based on the Takagi-Sugeno-Kang fuzzy system. The fuzzy modeling has an intrinsic inconsistency. It may perform thinking tolerant to imprecision, but learning methods are zero-tolerant to imprecision. The proposed methods make it possible to exclude this intrinsic inconsistency of a fuzzy modeling, where zero-tolerance learning is used to obtain fuzzy model tolerant to imprecision. These new methods can be called /spl epsiv/-insensitive learning or /spl epsiv/ learning, where, in order to fit the fuzzy model to real data, the /spl epsiv/-insensitive loss function is used. This leads to a weighted or "fuzzified" version of Vapnik's support vector regression machine. This paper introduces two approaches to solving the /spl epsiv/-insensitive learning problem. The first approach leads to the quadratic programming problem with bound constraints and one linear equality constraint. The second approach leads to a problem of solving a system of linear inequalities. Two computationally efficient numerical methods for the /spl epsiv/-insensitive learning are proposed. The /spl epsiv/-insensitive learning leads to a model with the minimal Vapnik-Chervonenkis dimension, which results in an improved generalization ability of this model and its outliers robustness. Finally, numerical examples are given to demonstrate the validity of the introduced methods.  相似文献   

19.
The problem of neural network model synthesis using the fractal analysis is addressed in the paper. The set of indicators characterizing the data sample properties from the unified position based on the fractal analysis principles is proposed. The methods of sample fractal dimension determining are proposed. These methods and indicators can be used to solve the problem of data dimensionality reduction. The set of indicators characterizing properties of neural network model is proposed. These indicators can be used in the process of neural network synthesis for the weights set contrasting, also as to find and remove the non-informative features and non-informative connections from the neural network model. The developed indicators and methods are implemented in software and studied at practical problem solving.  相似文献   

20.
神经网络求解优化问题具有非常强大的实时计算功用,因此近年来受到了密切的关注.这里考察了求解无约束总体极小化问题的神经网络方法,提出了一种新的网络求解模型.从基于吸引域分析方法为出发点证明了所给网络平稳点集合的全局吸引性.分析了网络的电路实现,并估计了各个平稳点的吸引域.这些理论分析与估计是构造所提神经网络模型的依据,同时也是网络可靠运行的基础.此外,数值模拟试验也充分揭示了这个网络模型在实际运行中都能够很好地求解总体极小化问题,是一个十分有效的神经网络系统.这里的结果表明:这里提出的网络模型无论从理论上还是实际运行中都能够可靠且稳定地求解总体极值问题,基于吸引域构造神经网络的方法是一种很有潜力的神经网络求解优化问题的研究方向.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号