首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 281 毫秒
1.
为提高飞机装配调度计划应对装配质量不合格的能力,首先以两阶段近似动态决策为框架,研究装配质量与相关因素的映射关系和不确定性因素在不同决策周期的表现形式,并以最小化基于场景的项目工期期望值为目标函数建立整数规划模型;然后基于构建的飞机装配质量预测模型,设计了多层循环迭代搜索算法,算法第一层基于任务列表的编码方式优化任务执行顺序,第二层通过装配人员分配列表优化人员配置,第三层根据人员配置结果求解目标函数. 数值实验结果显示在工件质量预测值与实际值不一致的情况下,多层循环迭代搜索算法在任务开始时间偏差能够保持在2以下,表明该算法能够适应不确定性因素的变化,满足构建飞机装配动态调度计划的需求.  相似文献   

2.
介绍一种迭代函数构造方法,证明其具有收敛性;在此基础上,推导出一个自相似匹配条件,使得对于任一图象,根据匹配条件,可构造一组迭代函数,迭代结果与原图象相应的象素灰度值最大误差能控制在给定值内;并且求出满足匹配条件参数的解;最后给出一种自适应分割迭代函数构造算法.  相似文献   

3.
提出一种基于极值搜索算法的过热汽温控制系统PID参数优化策略.首先介绍了极值搜索算法的基本原理,然后基于该算法设计了过热汽温优化控制系统,最后通过大量仿真实验详细研究了极值搜索算法主要参数变化,以及采用不同目标函数,对优化结果的影响.该方法不依赖于对象的数学模型,而采用阶跃响应实验来获得系统性能指标相对于参数拢动量的梯度信号,在线调整PID控制器参数.仿真结果表明,基于该方法优化的过热汽温控制系统具有良好的动态调节品质和较强的适应性.  相似文献   

4.
本文提出测度值马尔可夫决策过程新模型.在此模型下,agent对环境的把握用测度概念来表示,于是agent则根据测度来决定自己的最优行动以得到最优策略,因此本文也提供了测度值马尔可夫决策过程的最优策略算法.该模型是部分可观察马尔可夫决策过程的推广,它反映人类思维的一个重要特征,人们在把握全部状态可能性(即对状态空间进行权衡度量)的态势下,思考问题并选择自己的最优行动.部分可观察马尔可夫决策过程只是它的一种特例.  相似文献   

5.
深度Q神经网络算法的值函数迭代算法大多为Q学习算法,这种算法使用贪婪值函数作逼近目标,不利于深度Q神经网络算法获得长期来看更好的策略。通过以期望思想求解的期望值函数取代贪婪值函数作为更新目标,提出了基于期望值函数的离策略深度Q神经网络算法,并结合DQN算法神经网络更新方法,给出期望值函数能够作用于DQN算法的解释。通过使用该算法能够快速获得长期回报较高的动作和稳定的策略。最后分别在CarPole-v1和Acrobot仿真环境中对期望值函数的离策略深度Q神经网络算法和深度Q神经网络算法进行获取策略的稳定性对比实验,结果表明,基于期望值函数的离策略深度Q神经网络算法能够快速获得长期回报较高的动作,并且该算法表现更为稳定。  相似文献   

6.
提出一种结合多样性策略的自适应粒子群优化算法,该算法在粒子群的全局优化过程中,使用根据种群搜索状态自适应调整邻域空间的局部搜索算法加强算法的局部搜索能力,并允许非优粒子具有引导种群搜索方向的可能性.在著名基准函数上的对比实验结果表明,这种混合粒子群优化算法能获得更高的搜索成功率和质量更好的解,特别在高维多峰函数优化上表现出较强的竞争力.  相似文献   

7.
在许多实际问题中经常通过优化模型来指导决策.在这些模型中,存在着需要指定或估计的参数.而这些参数作为随机变量要限制在一个分布集合内,保守决策综合考虑了集合中分布最坏的情况下进行的优化求解.所以,此类问题的关键就是不确定集的构造.在本文中,研究了概率分布集合由JS-散度定义的CVaR分布鲁棒优化问题.对目标函数中的期望值函数,经过适当的度量测度的选取、Lagrange对偶理论将问题转化为经验分布下的约束优化问题,从而得到期望值函数的等价形式.对于约束中的CVaR函数,类似的方法也可以得到其等价形式.因此,最终可得到基于JS-散度的CVaR分布鲁棒投资组合优化问题的等价形式.  相似文献   

8.
类似于讨论时齐马尔可夫过程时的情况 ,给出关于双参数半群的 r上中值函数和 r盈函数的概念并讨论它们的若干性质 ,由此推导出关于非时齐马尔可夫过程的随机连续性方面的一些结果  相似文献   

9.
针对在传统PID(比例-积分-微分)控制器中调整3个参数时不易推导出被控对象的传递函数,且这些参数不易手动调整的问题,提出一种新算法用于调整PID控制器参数.该算法将神经网络和遗传算法相结合,先利用神经网络的模拟功能协助遗传算法计算适应度,训练出一个神经网络模拟被控对象;然后在遗传算法进化中不断地优化PID控制的3个参数.与传统的参数凑试法进行对比仿真实验的结果表明,该算法具有较强的鲁棒性及较快的响应速度.  相似文献   

10.
利用在无线通信中数据业务的突发性、信道时变以及功率和时延具有折衷关系等特点,研究了广播信道中基于时延约束下功率最小化的调度策略.先将该优化问题转化为非约束马尔可夫动态决策过程,然后用动态规划的方法获得最优解.针对该方法的高复杂度,提出一种简便策略,该策略只根据当前信道状态和队列长度做出决策,从时间和用户二维空间的搜索算法转化为简单函数的运算,复杂度大大降低.仿真结果显示该策略的性能接近最优.  相似文献   

11.
群进化算法是智能计算领域研究的核心内容,而算法中数值型参数的设置是影响算法搜索效率的重要因素,因此设计解决参数设置问题的方法也是群进化算法研究的重要内容.目前解决参数设置问题的常规统计方法是根据算法搜索的部分结果组成有限样本数据,依据统计最好值个数大小的判定结果来确定最优参数预设值.常规统计方法在有些测试样本数据中很难确定唯一的最优参数预设值.为了解决常规统计方法的缺点,提出了一种最优向量法,该方法可以将任意形式有限样本数据转换为向量,依据向量计算的判定规则进行最优参数预设值的确定.实验结果表明,依据获取的有限样本数据通过最优向量法找到最优参数值,采用该参数值的群进化算法搜索效率相对最优,从而验证了最优向量法的有效性.  相似文献   

12.
研究了一类半Markov控制过程(SMCP)在紧致行动集上关于无限水平平均代价准则的性能优化算法.利用等价Markov过程的方法,导出了SMCP的性能势公式和平均代价最优性方程,给出了求解最优或次最优平稳策略的策略迭代算法和数值迭代算法,并证明了算法的收敛性.最后给出了一个数值例子来说明算法的应用.  相似文献   

13.
向征  何雨阳  全志伟 《科学技术与工程》2022,22(32):14494-14501
目前,空中流量激增导致空域资源紧张的问题越发凸显,为了缓解这一现状,将基于流量管理层面对航空器进行改航路径的研究。首先采用栅格化的方式对空域环境进行离散化处理,根据航路点流量的拥挤程度把空域划分为三种不同类型的栅格区域。其次通过改进强化学习中马尔科夫决策过程的奖励函数对其进行建模,并基于 策略运用Q-Learning算法对该模型进行迭代求解,对相应的参数取值进行探究比较以提高结果的可适用性。最后经过仿真运行,计算出不同参数赋值下的最优路径及相应的性能指标。研究结果表明:应用该模型和算法可以针对某一时段内的流量拥堵空域搜索出合适的改航路径,使飞机避开流量拥挤的航路点,缩短空中延误时间,有效改善空域拥堵的现况。  相似文献   

14.
连续时间Markov控制过程的平均代价最优鲁棒控制策略   总被引:2,自引:0,他引:2  
在Markov性能势基础上 ,研究了一类转移速率不确定但受紧集约束的遍历连续时间Markov控制过程 (CTMCP)的鲁棒控制问题 .根据系统的遍历性 ,平均代价Poisson方程的解可被看作是性能势的一种定义 .在平均代价准则下 ,优化控制的目标是选择一个平稳策略使得系统在参数最坏取值下能获得最小无穷水平平均代价 ,据此论文给出了求解最优鲁棒控制策略的策略迭代 (PI)算法 ,并详细讨论了算法的收敛性 .  相似文献   

15.
杂草算法收敛性分析及其在工程中的应用   总被引:4,自引:0,他引:4  
针对从自然界中杂草的生长繁殖特性演化而来的新型智能优化算法———扩张性杂草进化算法,通过马尔可夫链,分析证明了它的全局收敛性.相比其他启发式算法,其最大优点是基于种群中优秀的个体有指导地进行搜索,且算法中子代个体按正态分布的方式分布于父代个体周围,在进化过程中通过动态调整此正态分布的标准差,使算法在早期与中期充分保持群落的多样性,较其他启发式算法更容易保证对解空间的全面搜索.而在算法的后期加强对优秀个体周围的局部搜索,从而保证算法能够稳健地收敛到全局最优解.典型的复杂机械优化设计算例结果表明,该算法在优化过程中能有效避开局部最优解,快速、有效地收敛到全局最优解.  相似文献   

16.
针对监测费用昂贵导致难以实施连续监测和维修效果通常不完美的问题,研究了维修效果不完美情形下部分可观测系统的最优维修策略.在假设系统的性能退化状态变化规律可以用马尔可夫链进行描述的基础上,利用部分可观测马氏决策过程对该系统进行维修决策建模,并通过引入信息状态将其转化为完全可观测马氏决策过程;引入维修效果矩阵用以刻画维修效果对最优维修策略的影响;针对所建立的最优方程以单位时间期望维修费用最小为目标设计了最优维修决策算法.通过数值仿真验证了所提算法的有效性.  相似文献   

17.
提出一种基于改进粒子群优化(PSO)算法的优化混合核支持向量机(SVM)算法(ILPSO), 解决了一般混合核SVM算法很难评定参数选择的问题. 该算法通过限定粒子的速度、 搜索空间和交叉算子等多种寻优策略加强其收敛特性, 得到了参数的最佳组合. 仿真实验表明, 该算法能更快速、 有效地获得参数的最优值.  相似文献   

18.
基于(s,S)库存策略的分销系统最优分配问题   总被引:4,自引:0,他引:4  
分销系统的运营成本不仅与所采取的库存控制策略有关,也与配送中心在货源不足时的分配策略有关。该文讨论单品种、单配送中心多销售点、周期观察、随机需求的两级分销系统。配送中心及各销售点都采用(s,S)库存控制策略,顾客对销售点的需求过程服从Po isson过程。在给定配送中心向销售点分配策略的情况下,系统的状态转移形成一个离散时间的M arkov链,因此系统的最优分配策略问题是一个M arkov决策问题。采用策略迭代或值迭代的办法,可以求解系统的最优库存分配策略。数值算例表明,采用最优库存分配策略能显著降低系统的成本。  相似文献   

19.
改进的混沌优化算法研究   总被引:3,自引:0,他引:3  
崔畅  赵强 《科学技术与工程》2007,7(3):307-309313
分析了一类混沌优化算法所存在的不足,即在二次载波过程中只是在近似最优解的单侧邻域内进行搜索,同时可调参数也不能随着搜索进程的变化而变化,使得寻优结果并不是很理想。对此进行了适当地改进,利用混沌变量对当前点进行扰动,并且通过时变参数逐渐减小搜索进程中的扰动幅度,同时,以一定方式确定了时变参数的初值。用改进后的算法对连续对象的全局优化问题进行优化,仿真结果表明,该方法可以显著提高收敛速度和精度。  相似文献   

20.
为了更好地保障集束型晶圆制造设备运行的可靠性,同时考虑维护的经济性,建立了基于Markov过程的预防性维护策略.根据集束型设备的特点,采用大修和小修相结合的预防性维护方式,同时考虑随机失效和退化失效两种失效形式,建立了状态转移模型.依据Markov理论求得设备各状态的稳态概率及状态转移概率.再根据Markov决策理论及策略迭代算法求得最佳维护策略.实验结果表明,所提出的预防性维护策略有效可行.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号