首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 281 毫秒
1.
提出了一种数据驱动的作业车间调度算法,训练样本来源于基准实例和部分实际生产数据,通过特征函数来构建样本的特征数据并进行归一化处理,标签数据由调度任务和相应的调度规则的映射关系构成,以LSTM模型为主框架,在模型中嵌入指针网络,将当前序列中概率最大的工件优先进入缓冲区,提高了神经网络的训练速度和质量,采用训练后的模型对新问题进行求解。结果证明了所构建模型的有效性,同时为求解作业车间调度问题提供了新思路。  相似文献   

2.
阳名钢  陈梦烦  杨双远  张德富 《软件学报》2021,32(12):3684-3697
二维带形装箱问题是一个经典的NP-hard的组合优化问题,该问题在实际的生活和工业生产中有着广泛的应用.研究该问题,对企业节约成本、节约资源以及提高生产效率有着重要的意义.提出了一个强化学习求解算法.新颖地使用强化学习为启发式算法提供一个初始的装箱序列,有效地改善启发式冷启动的问题.该强化学习模型能进行自我驱动学习,仅使用启发式计算的解决方案的目标值作为奖励信号来优化网络,使网络能学习到更好的装箱序列.使用简化版的指针网络来解码输出装箱序列,该模型由嵌入层、解码器和注意力机制组成.使用Actor-Critic算法对模型进行训练,提高了模型的效率.在714个标准问题实例和随机生成的400个问题实例上测试提出的算法,实验结果显示:提出的算法能有效地改善启发式冷启动的问题,性能超过当前最优秀的启发式求解算法.  相似文献   

3.
现有的基于Word2vec的网络表示学习(NRL)算法使用随机游走(RW)来生成节点序列,针对随机游走倾向于选择具有较大度的节点,生成的节点序列不能很好地反映网络结构信息,从而影响表示学习性能的问题,提出了基于改进随机游走的网络表示学习算法。首先,使用RLP-MHRW算法生成节点序列,它在生成节点序列时不会偏向大度节点,得到的节点序列能更好地反映网络结构信息;然后,将节点序列投入到Skip-gram模型得到节点表示向量;最后,利用链路预测任务来测度表示学习性能。在4个真实网络数据集上进行了实验。在论文合作网络arXiv ASTRO-PH上与LINE和node2vec算法相比,链路预测的AUC值分别提升了8.9%和3.5%,其他数据集上也均有提升。实验结果表明,RLP-MHRW能有效提高基于Word2vec的网络表示学习算法的性能。  相似文献   

4.
联邦学习中由于不同客户端本地数据分布异质,在本地数据集上训练的客户端模型优化目标与全局模型不一致,导致出现客户端漂移现象,影响全局模型性能.为了解决非独立同分布数据带来的联邦学习模型性能下降甚至发散的问题,文中从本地模型的通用性角度出发,提出基于结构增强的异质数据联邦学习模型正则优化算法.在客户端利用数据分布异质的本地数据进行训练时,以结构化的方式采样子网络,并对客户端本地数据进行数据增强,使用不同的增强数据训练不同的子网络学习增强表示,得到泛化性较强的客户端网络模型,对抗本地数据异质带来的客户端漂移现象,在联邦聚合中得到性能更优的全局模型.在CIFAR-10、CIFAR-100、ImageNet-200数据集上的大量实验表明,文中算法性能较优.  相似文献   

5.
基于Seq2Seq框架的生成式文本摘要模型取得了不错的研究进展,但此类模型大多存在未登录词、生成文本重复、曝光偏差问题。为此,本文提出基于对抗性扰动对比学习的指针生成器网络PGN-CL来建模文本摘要生成过程,该模型以指针生成器网络PGN为基本架构,解决摘要模型存在的未登录词和生成文本重复的问题;采用对抗性扰动对比学习作为一种新的模型训练方式来解决曝光偏差问题。在PGN模型的训练过程中,通过向目标序列添加扰动并建立对比损失函数来生成对抗性正负样本,使负样本与目标序列在嵌入空间相似但语义差别很大,正样本与目标序列在语义空间很相近但嵌入空间差距较大,这些区分困难的正负样本可以引导PGN模型在特征空间更好地学习到正负样本的区分特征,获得更准确的摘要表示。在LCSTS数据集上的实验结果表明,提出的模型在ROUGE评价指标上的表现优于对比基线,证明了融合指针生成器网络和对抗性扰动对比学习对摘要质量提升的有效性。  相似文献   

6.
在网络带宽受限的情况下, 综合考虑了系统响应的误差和误差变化率, 设计了一个共享通信网络的模糊反馈调度器. 该调度器采用模糊最大优先调度算法对网络消息发送的优先级进行动态调整. 同时定义了一种归一化控制质量衡量指标来评价多回路系统的控制性能. 在此评价方法下, 对三种不同调度算法在不同随机时延序列下进行了仿真比较. 结果表明本文提出的调度算法优化了系统的控制性能, 并在不确定运行环境中具有更好的适应性.  相似文献   

7.
杜友田  李谦  周亚东  吴陈鹤 《自动化学报》2012,38(12):1923-1932
网络图像通常包含文本、颜色和纹理等异质信息. 本文提出了一种基于多类异质信息融合的网络图像半监督学习方法---局部协同训练(Local co-training, LCT). 该方法在每个视图(对应一类 信息)上对每个样本点的邻域构建线性局部模型, 利用一组局部模型来表示数据关系;基于信息传播和协同训练对模型进行增量式迭代更新. 该算法在协同训练和基于图正则化的方法这两类半监督学习算法间建立了桥梁. 局部协同训练算法能够准确地描述样本的复杂分布, 并且可以进行高效的增量学习, 有利于大规模网络图像的在线学习. 在Corel, Pascal和ImageNet数据集上的实验结果表明该方法具有良好的性能.  相似文献   

8.
针对当前多智能体强化学习算法难以适应智能体规模动态变化的问题,文中提出序列多智能体强化学习算法(SMARL).将智能体的控制网络划分为动作网络和目标网络,以深度确定性策略梯度和序列到序列分别作为分割后的基础网络结构,分离算法结构与规模的相关性.同时,对算法输入输出进行特殊处理,分离算法策略与规模的相关性.SMARL中的智能体可较快适应新的环境,担任不同任务角色,实现快速学习.实验表明SMARL在适应性、性能和训练效率上均较优.  相似文献   

9.
王凌  潘子肖 《控制与决策》2021,36(11):2609-2617
流水车间调度是应用背景最为广泛的调度问题,其智能算法研究具有重要的学术意义和应用价值.以最小化最大完工时间为目标,提出求解流水车间调度的一种基于深度强化学习与迭代贪婪算法的框架.首先,设计一种新的编码网络对问题进行建模,解决了传统模型受问题规模影响而难以扩展的缺陷,并利用强化学习训练模型以获取优良输出结果;然后,提出一种带反馈机制的迭代贪婪算法,以网络的输出结果为初始解,协同利用多种局部操作提高搜索能力,并根据性能反馈调节各操作的使用,进而获得最终的调度解.仿真结果和统计对比表明,所提出的深度强化学习与迭代贪婪融合的算法能够取得更好的性能.  相似文献   

10.
饶东宁  罗南岳 《计算机工程》2023,49(2):279-287+295
堆垛机调度是物流仓储自动化中的重要任务,任务中的出入库效率、货物存放等情况影响仓储系统的整体效益。传统调度方法在面对较大规模调度问题时,因处理大状态空间从而导致性能受限和收益降低。与此同时,库位优化与调度运行联系密切,但现有多数工作在处理调度问题时未能考虑到库位优化问题。为解决仓储中堆垛机调度问题,提出一种基于深度强化学习算法的近端策略优化调度方法。将调度问题视为序列决策问题,通过智能体与环境的持续交互进行自我学习,以在不断变化的环境中优化调度。针对调度中伴生的库位优化问题,提出一种基于多任务学习的调度、库位推荐联合算法,并基于调度网络构建适用于库位推荐的Actor网络,通过与Critic网络进行交互反馈,促进整体的联动和训练,从而提升整体效益。实验结果表明,与原算法模型相比,该调度方法的累计回报值指标平均提升了33.6%,所提的多任务学习的联合算法能有效地应对堆垛机调度和库位优化的应用场景,可为该类多任务问题提供可行的解决方案。  相似文献   

11.
中厚板热轧生产调度, 是一个有优先约束、等待时间和缓冲容量有限的单机调度问题. 用AON (Activity-on-node)网络对问题进行描述, 提出并证明了面向单机调度问题的AON网络平衡定理, 根据平衡定理, 建立了以轧机利用率最大为优化目标的非线性约束优化数学模型, 并利用优化软件LINGO进行求解. 计算实例表明, 所提出的数学优化方法, 与现有的启发式方法相比, 能够获得更好的优化目标, 所得到的生产调度方案, 生产节奏稳定, 更有利于组织生产.  相似文献   

12.
带平衡约束的矩形布局问题源于卫星舱设备布局设计,属于组合优化问题。深度强化学习利用奖赏机制,通过数据训练实现高性能决策优化。针对布局优化问题,提出一种基于深度强化学习的新算法DAR及其扩展算法IDAR。DAR用指针网络输出定位顺序,再利用定位机制给出布局结果,算法的时间复杂度是O(n3);IDAR算法在DAR的基础上引入迭代机制,算法时间复杂度是O(n4),但能给出更好的结果。测试表明DAR算法具有较好的学习能力,用小型布局问题进行求解训练所获得的模型,能有效应用在大型问题上。在两个大规模典型算例的对照实验中,提出算法分别超出和接近目前最优解,具有时间和质量上的优势。  相似文献   

13.
A hot strip mill (HSM) produces hot rolled products from steel slabs, and is one of the most important production lines in a steel plant. The aim of HSM scheduling is to construct a rolling sequence that optimizes a set of given criteria under constraints. Due to the complexity in modeling the production process and optimizing the rolling sequence, the HSM scheduling is a challenging task for hot rolling production schedulers. This paper first introduces the HSM production process and requirements, and then reviews previous research on the modeling and optimization of the HSM scheduling problem. According to the practical requirements of hot rolling production, a mathematical model is formulated to describe two important scheduling sub-tasks: (1) selecting a subset of manufacturing orders and (2) generating an optimal rolling sequence from the selected manufacturing orders. Further, hybrid evolutionary algorithms with integration of genetic algorithm (GA) and extremal optimization (EO) are proposed to solve the HSM scheduling problem. Computational results on industrial data show that the proposed HSM scheduling solution can be applied in practice to provide satisfactory performance.  相似文献   

14.
基于分层强化学习的通用装配序列规划算法   总被引:1,自引:0,他引:1  
对于装配序列规划问题,现有算法大多聚焦于单一的目标构型.对于多目标构型以及大规模问题,现有算法往往存在维数灾难及泛化能力差等问题.为此,利用装配序列规划问题分层结构的特点,提出一种基于分层强化学习的适用于多构型装配任务的通用装配序列规划方法.首先,将装配序列规划问题构建为一个分层的马尔科夫决策过程,其中,上层进行序列规...  相似文献   

15.
具有提前ö拖期惩罚的热轧钢管批调度问题研究   总被引:2,自引:0,他引:2  
建立了具有提前/拖期惩罚的热轧钢管批调度问题的混合整数非线性规划模型,提出并证明了给定合同排序下的最优组批方式,从而将原问题转化为易求解的合同排序问题.同时,建立了转化问题的数学模型并设计了遗传算法.仿真实验验证了模型和算法的有效性.  相似文献   

16.
针对遗传算法在求解旅行商问题时,受限于初始种群质量而存在收敛速度慢、易陷入局部最优等问题,提出一种基于指针网络改进遗传算法种群模型。通过经改进指针网络生成初始种群取代原种群,并结合基于汉明距离轮盘赌策略对种群个体进行择优,形成个体质量和种群多样性高的新种群。实验在TSPLIB标准库上多组实例进行测试,并和研究进展种群改进算法和多种主流启发式算法进行多项系数对比。结果表明,经过优化后算法的收敛速度和寻优能力有显著提高,能够有效用于改善遗传算法在旅行商问题上的应用。  相似文献   

17.
基于蚁群算法的Ad Hoc网组播路由算法   总被引:1,自引:0,他引:1  
网络拓扑结构动态变化、带宽和能源受限等特点使得Ad Hoc组播路由问题成为当前研究的热点问题.现有的Ad Hoc网组播协议多为确定性路由,对Ad Hoc网网络环境的变化适应性较差.在深入研究蚁群算法的基础上,对其进行了改进,将其应用在Ad Hoc网组播路由的建立和维护过程中,提出了一种不确定性的组播路由算法,称为基于蚁群算法的Ad Hoc组播路由算法.NS-2仿真结果证明,蚁群算法在Ad Hoc组播路由中的应用使组播路由算法具有较高的稳定性和良好的传输有效性,受网络环境的影响较小.  相似文献   

18.
针对移动边缘计算中具有依赖关系的任务的卸载决策问题,提出一种基于深度强化学习的任务卸载调度方法,以最小化应用程序的执行时间。任务调度的过程被描述为一个马尔可夫决策过程,其调度策略由所提出的序列到序列深度神经网络表示,并通过近端策略优化(proximal policy optimization)方法进行训练。仿真实验表明,所提出的算法具有良好的收敛能力,并且在不同环境下的表现均优于所对比的六个基线算法,证明了该方法的有效性和可靠性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号