首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 31 毫秒
1.
工业过程数据中缺失值处理方法的研究   总被引:1,自引:0,他引:1  
针对工业生产中过程数据的缺失问题,首次提出了运用多重填补方法处理工业过程的缺失数据.阐述了常用的缺失数据处理方法,指出各方法的优缺点.在此基础上,通过建立回归模型,针对多变量工业数据中缺失值较少和较多时的两种情况,分别用删除含缺失值的个案,简单填补和多重填补(MI)3种方法对数据进行处理,利用处理后的新数据集进行数据挖掘,预测目标变量的值,并对预测结果进行分析比较.实验结果表明,多重填补方法的处理效果最好,为工业数据的缺失值处理提供了有用的策略.  相似文献   

2.
误差生成是基于机理模型故障检测方法的核心本质,但鲜有应用于统计过程监测方法中.为此,提出一种基于缺失数据的误差生成策略,将能反映出采样数据对统计模型拟合程度的误差作为新的被监测对象实施故障检测.所提出的基于缺失数据的主元分析(MD-PCA)方法通过逐一假设各变量测量数据缺失后,利用缺失数据处理方法推测出相应缺失数据的估计值,并对缺失数据的实际值与估计值之间的误差实施基于PCA模型的故障检测.利用误差实施故障检测的优势在于,生成的误差能在一定程度上降低原测量变量的非高斯性程度,而且误差体现的是对应缺失变量中与其他测量变量不相关的成分信息,更能揭示各测量变量的本质.通过在TE过程上的实验充分验证了所提出方法的优势,以及MD-PCA方法用于故障检测的可行性与优越性.  相似文献   

3.
《计算机科学与探索》2017,(10):1557-1569
研究了高维相关性缺失数据的填补方法,提出了分块填补算法。该算法核心思想是:在填补数据的过程中会考虑变量之间的相互关系,仅利用与待填补数据有相关性的数据进行填补,从而降低不相关数据对缺失数据填补的影响,提高数据填补的准确度。同时,该算法能够并行处理缺失数据,从而提高数据填补效率,对于高维缺失数据的填补有重要意义。为了对分块情况未知的缺失数据进行分块,提出了基于k-means聚类的分块算法。大量的仿真实验和基于真实数据集的实验表明,对于相关性数据,分块填补算法能够有效地利用相关信息进行填补,从而提高数据填补准确度。  相似文献   

4.
数据缺失会影响数据的质量,可能导致分析结果的不准确和降低模型的可靠性,缺失值填补能减低偏差方便后续分析.大多数的缺失值填补算法,都是假设多项缺失值之间是弱相关甚至无相关,很少考虑缺失值之间的相关性以及填补顺序.在销售领域中对缺失值进行独立填补,会减少缺失值信息的利用,从而对缺失值填补的准确度造成较大的影响.针对以上问题,本文以销售领域为研究目标,根据销售行为的多维度特征,利用不同模型输出值的空间分布特征特性,探索多项缺失值的填补更新机制,研究面向销售数据多项缺失值增量填补方法,根据特征相关性,对缺失特征排序并用已填补的数据作为信息要素融合对后面的缺失值进行增量填补.该算法同时考虑了模型的泛化性和缺失数据之间的信息相关问题,并结合多模型融合,对多项缺失值进行有效填补.最后基于真实连锁药店销售数据集通过大量实验对比验证了所提算法的有效性.  相似文献   

5.
在工业过程中,有很多重要变量往往无法在线检测,通常通过软测量方法进行估计,主元回归是其中1种常用方法。相比于主元,因子更具广泛意义,更能反映数据的本质特征。基于此,提出1种基于因子回归模型的软测量方法,先对过程日常运行数据进行因子分析,建立因子生成模型,并提取因子信息,然后建立因子与关键变量间的因子回归模型,在线应用时先将可测变量代入生成模型得到因子变量,然后将因子代入到因子回归模型,软测量出关键变量。将该方法应用到化工吸附分离过程中,比较了因子回归模型与主元回归模型的软测量效果,结果表明前者优于后者。  相似文献   

6.
针对复杂工业过程中存在的数据非线性的问题,对基于数据局部特征的回归模型构建和软测量建模方法进行研究。基于邻域保持嵌入(NPE)算法思想,利用数据间局部关系特征,建立多目标的回归优化函数,提出了基于局部的数据回归(LDR)算法。该方法基于数据的局部关系和邻域特征,在保留输入数据和输出数据局部特征的同时,获取数据间的最大相关关系。通过数据低维潜变量获取数据的回归关系,并建立软测量预测模型。将模型应用于工业案例中,预估产品的质量和难以在线测量的关键变量。脱丁烷塔的案例研究证明了所提出的方法在变量预测方面的有效性。与基于全局特征的软测量模型的对比分析结果表明,所提出的LDR在获取非线性数据相关性和增强数据预测精度方面具有显著的改善效果。  相似文献   

7.
近年来,变分自编码器(Variational auto-encoder,VAE)模型由于在概率数据描述和特征提取能力等方面的优越性,受到了学术界和工业界的广泛关注,并被引入到工业过程监测、诊断和软测量建模等应用中.然而,传统基于VAE的软测量方法使用高斯分布作为潜在变量的分布,限制了其对复杂工业过程数据,尤其是多模态数据的建模能力.为了解决这一问题,本论文提出了一种混合变分自编码器回归模型(Mixture variational autoencoder regression,MVAER),并将其应用于复杂多模态工业过程的软测量建模.具体来说,该方法采用高斯混合模型来描述VAE的潜在变量分布,通过非线性映射将复杂多模态数据映射到潜在空间,学习各模态下的潜在变量,获取原始数据的有效特征表示.同时,建立潜在特征表示与关键质量变量之间的回归模型,实现软测量应用.通过一个数值例子和一个实际工业案例,对所提模型的性能进行了评估,验证了该模型的有效性和优越性.  相似文献   

8.
武森  冯小东  单志广 《计算机学报》2012,35(8):1726-1738
缺失数据的处理是数据挖掘领域进行数据预处理的一个重要问题.传统的缺失数据填补方法大部分是基于概率分布等一些统计假设,对于大数据集的数据挖掘不一定是最适合的方法.受不完备数据分析(ROUSTIDA)未采用传统的概率统计学方法启发,提出基于不完备数据聚类的缺失数据填补方法(MIBOI),针对分类变量不完备数据集定义约束容差集合差异度,直接计算不完备数据对象集合内所有对象的总体相异程度,以不完备数据聚类的结果为基础进行缺失数据的填补.采用UCI机器学习基准数据集进行实验表明,MIBOI对缺失数据的填补是有效可行的.  相似文献   

9.
在工业过程控制中,常常存在一些重要的变量难以测量,为了解决这个问题,出现了软仪表.软仪表的实质是建立被测量参数与影响该参数的其它操作参数之间的数学模型,通过计算得出此类难于测量的变量的数值.小波神经网络就是软测量的一种方法.在传统的小波神经网络的基础上进行了改进,利用小波对工业现场过来的数据进行了降噪,并使用主元分析法去除了数据的相关性.然后对处理过的数据建立小波神经网络模型,最后通过计算机仿真证实了该方法的良好的收敛速度快,不容易陷入极度最小等辨识效果.  相似文献   

10.
在图像分类和工业视觉检测过程中,缺陷样本量少导致神经网络分类器训练效率低及检测精度差,直接采用原始的离散标签又无法使网络分类器学习到不同类别间的相似度信息。针对上述问题,在区域丢弃算法的基础上,提出一种基于生成对抗网络的知识蒸馏数据增强算法。使用补丁对丢弃区域进行填补,减少区域丢弃产生的非信息噪声。在补丁生成网络中,保留生成对抗网络的编码器-解码器结构,利用编码器卷积层提取特征,通过解码器对特征图上采样生成补丁。在样本标签生成过程中,采用知识蒸馏算法中的教师-学生训练模式,按照交叉检验方式训练教师模型,根据教师模型生成的软标签对学生模型的训练进行指导,提高学生模型对特征的学习能力。实验结果表明,与区域丢弃算法相比,该算法在CIFAR-100、CIFAR-10数据集图像分类任务上的Top-1 Err、Top-5 Err分别降低3.1、0.8、0.5、0.6个百分点,在汽车转向器轴承数据集语义分割任务上的平均交并比和识别准确率分别提高2.8、2.3个百分点。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号