首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 218 毫秒
1.
张林  刘辉 《自动化学报》2012,38(10):1709-1713
面向 Illumina GoldenGate 甲基化微阵列数据提出了一种基于模型的聚类算法. 算法通过建立贝塔无限混合模型, 采用 Dirichlet 过程作为先验, 实现了基于数据和模型的聚类结构的建立, 实验结果表明该算法能够有效估计出聚类类别个数、 每个聚类类别的混合权重、每个聚类类别的特征等信息, 达到比较理想的聚类效果.  相似文献   

2.
对乙烯裂解炉建立实时监控模型具有重要的现实意义,而传统的多元统计过程监控方法都是假设过程处于单一工况下,而随着过程参数(进料负荷、产品组分等)的改变,工况也随之改变,传统方法便不再适用.本文针对工业过程中的多工况问题,提出了一种基于自适应模糊聚类的多模型过程监控方法,该方法可以减少监控方法对过程知识的依赖性,并且能够适应实际工业过程的非高斯性和非线性特征.首先对影响工况的过程变量利用自适应模糊聚类进行工况划分,然后对每种工况的建模数据分别利用最大方差展开(MVU)提取低维信息,再用支持向量数据描述(SVDD)建立多模型过程监控模型,最后再利用相应的统计指标进行过程监控.将上述方法应用在乙烯裂解炉上,并与基于高斯混合模型的多PCA方法(GMM-MPCA)进行了比较.仿真实验中,监控对裂解炉运行影响最大的33个变量,根据聚类有效性指标,将数据划分为5类时可以得到最佳的聚类效果.通过实验,将33维建模数据降到20维时误报率最小.仿真结果表明该方法在对非线性和非高斯性过程的监控上,能达到很好的效果,误报率和检测率均优于GMM-MPCA方法.  相似文献   

3.
子空间聚类算法是一种面向高维数据的聚类方法,具有独特的数据自表示方式和较高的聚类精度。传统子空间聚类算法聚焦于对输入数据构建最优相似图再进行分割,导致聚类效果高度依赖于相似图学习。自适应近邻聚类(CAN)算法改进了相似图学习过程,根据数据间的距离自适应地分配最优邻居以构建相似图和聚类结构。然而,现有CAN算法在进行高维数据非线性聚类时,难以很好地捕获局部数据结构,从而导致聚类准确性及算法泛化能力有限。提出一种融合自动权重学习与结构化信息的深度子空间聚类算法。通过自编码器将数据映射到非线性潜在空间并降维,自适应地赋予潜在特征不同的权重从而处理噪声特征,最小化自编码器的重构误差以保留数据的局部结构信息。通过CAN方法学习相似图,在潜在表示下迭代地增强各特征间的相关性,从而保留数据的全局结构信息。实验结果表明,在ORL、COIL-20、UMIST数据集上该算法的准确率分别达到0.780 1、0.874 3、0.742 1,聚类性能优于LRR、LRSC、SSC、KSSC等算法。  相似文献   

4.
聚类算法在抽取文本数据中的模式结构时,忽略多个语种信息之间潜在的互补作用,得到的模式结构不能充分反映数据的内在信息.针对此问题,文中提出基于并行信息瓶颈的多语种文本聚类算法.首先使用词袋模型为文本数据的不同语种信息构建相应的相关变量.然后将多种相关变量引入并行信息瓶颈方法,通过最大化地保存模式结构与多个相关变量之间的信息,使得到的模式结构能够反映数据的多个语种信息.最后提出基于信息论的抽取合并方法优化文中算法的目标函数,保证其收敛到局部最优解.实验表明,文中算法能有效处理文本数据的多个语种信息,性能优于单语种聚类算法和现有的两类能够处理文本多语种信息的聚类算法.  相似文献   

5.
作为深度神经网络向非欧式数据上的扩展,图神经网络(GNN)已经在图节点分类任务、链接预测任务和图分类任务中取得了显著成就。在图分类任务上,当前方法一般通过层次化的池化过程同时考虑图的局部和全局结构信息以学习高层次的图表示。在对当前的图分类模型进行对比分析后,考虑当前方法的不足,结合不同方法的优势,提出结构和特征融合池化模型(SAFPool)。SAFPool模型在池化时使用了两个聚类分配矩阵生成模块,分别是基于结构的聚类学习和基于特征的聚类学习模块,基于结构的聚类学习根据图结构信息对结构相似的节点聚类,基于特征的聚类学习则根据图节点特征对特征相似的节点聚类。二者的聚类结果加权聚合后便能获取实现聚类策略的聚类分配矩阵以同时利用图结构和节点特征信息。最后,在多个图分类数据集上通过对比实验和可视化说明了同时显式地利用图节点特征信息和图结构信息实现聚类策略的有效性。  相似文献   

6.
实际工业过程往往是一个多工况、非线性的大规模复杂系统,使得单一模型软测量建模方法难以充分挖掘数据信息。针对这一问题提出了一种基于密度峰(Density Peak,DP)聚类和随机森林回归(Random Forest Regression,RFR)的多模型软测量建模方法,从而对主导变量进行估计。首先,利用DP聚类算法对训练数据进行划分;其次,采用RFR方法建立各子类的回归子模型;最后采用开关切换的方法进行多模型融合。将提出方法应用于TE过程和丁烷蒸馏过程的软测量建模中,分别对产物G含量和丙烷含量进行估计。仿真结果表明估计精度得到提高,证明该方法是有效的。  相似文献   

7.
基于改进K-means聚类算法的组合模型建模   总被引:1,自引:0,他引:1  
杨慧中  董陶  陶洪峰 《控制工程》2013,20(2):201-203,208
在传统的K-means聚类算法中,初始聚类是随机选取的,其聚类结果易随着不同的初始聚类中心波动.针对这一问题,首先采用最大距离积法对传统K-means聚类算法的初始聚类中心进行了优化.同时定义了一种新的目标函数并将其引用到传统的K-means聚类算法中,以实现对聚类结构类别数K的优化选择.将训练集样本数据经上述方法聚类后,再将各个子类分别建立基于支持向量机的子模型,通过开关切换的方式连接各子模型得到组合的支持向量机模型.将该方法应用于双酚A生产过程的缩合反应单元溶解罐出口苯酚含量的软测量建模.工业实例仿真结果表明:该算法能较好地跟踪苯酚含量的变化趋势,有效地改善了数据分类效果,提高了软测量模型的估计精度,显示了它在工业领域的应用潜力.  相似文献   

8.
刘建伟  李卫民 《计算机科学》2009,36(11):148-151
传统的数据库管理系统和数据查询算法不能很好地支持对流数据的查询已经被广泛认识,因而需要研究新的流数据模式查询算法.提出了一种基于摘要技术的在线快速混合模型流数据聚类算法,该算法为分阶段混合模型聚类过程.算法首先时最初到达的流数据用多维网格结构进行划分,对划分形成的每一个单元进行数据摘要,提取足够的统计信息.对该摘要运行基于模型的贪心聚类算法,聚类形成的混合模型的摘要信息存储在永久摘要数据库中,从而形成初始聚类混合模型;在聚类模型的维持过程中,当不断有流数据到达时,对到达的数据块用多维网格结构进行划分,对划分形成的每一个单元提取足够的摘要信息.对该摘要运行基于模型的贪心聚类算法形成聚类混合模型.在判断是否可以把新到达的模型合并到现有的混合模型中去时,提出了三种合并标准.实验表明,该算法减少了分类误差,其速度也比传统的基于模型的贪心聚类算法大大加快.  相似文献   

9.
针对无监督聚类方法在应用于话题检测与追踪任务时难以学习到深层语义特征及任务相关特征,K均值聚类、潜在狄利克雷分布(LDA)等方法无法用于增量式聚类的问题,提出基于预训练语言模型的BERT-Single半监督算法。首先使用小规模有标注数据训练预训练语言模型BERT,使BERT模型学习到任务特定的先验知识,生成能够适应话题检测与追踪任务且包含深层语义特征的文本向量;然后利用改进的Single-Pass聚类算法将预训练语言模型学习到的有标签样本信息泛化到无标签数据上,提升模型在话题检测与追踪任务上性能。在构建的数据集上进行实验,结果显示,相较于对比模型,BERT-Single模型精确率至少提升了3个百分点、召回率至少提升了1个百分点、F1值至少提升了3个百分点。BERT-Single模型对于解决话题检测与追踪问题具有较好效果,并能够很好地适应增量式聚类任务。  相似文献   

10.
针对传统K-means聚类算法的聚类结果易随不同的初始聚类中心波动的问题,采用最大距离积法优化K-means聚类算法的初始聚类中心。传统的K-means聚类算法都假定样本的各维特征对聚类的贡献相同,影响了聚类效果和模型估计精度。为了考虑样本各维特征对聚类的不同影响,利用一种新型的特征加权K-means聚类算法逐步调整特征权值,最终有效改善了聚类效果。利用本文方法建立组合支持向量机模型,将其用于双酚A生产过程质量指标的软测量建模中,仿真结果表明该算法能够有效改进数据的分类效果并提高软测量模型的估计精度。  相似文献   

11.
Antti  Jeremias  Esa 《Neurocomputing》2008,71(7-9):1311-1320
Independent variable group analysis (IVGA) is a method for grouping dependent variables together while keeping mutually independent or weakly dependent variables in separate groups. In this paper two variants of an agglomerative method for learning a hierarchy of IVGA groupings are presented. The method resembles hierarchical clustering, but the choice of clusters to merge is based on variational Bayesian model comparison. This is approximately equivalent to using a distance measure based on a model-based approximation of mutual information between groups of variables. The approach also allows determining optimal cutoff points for the hierarchy. The method is demonstrated to find sensible groupings of variables that can be used for feature selection and ease construction of a predictive model.  相似文献   

12.
目的 高光谱图像的高维特性和非线性结构给聚类任务带来了"维数灾难"和线性不可分问题,以往的工作将特征提取过程与聚类过程互相剥离,难以同时优化。为了解决上述问题,提出了一种新的嵌入式深度神经网络模糊C均值聚类方法(EDFCC)。方法 EDFCC算法为了提取更加有效的深层特征,联合优化高光谱图像的特征提取和聚类过程,将模糊C均值聚类算法嵌入至深度自编码器网络中,可以保持两任务联合优化的优势,同时利用深度自编码器网络降维以及逼近任意非线性函数的能力,逐步将原始数据映射到潜在特征空间,提取数据的深层特征。所提方法采用模糊C均值聚类算法约束特征提取过程,学习适用于聚类的高光谱数据深层特征,动态调整聚类指示矩阵。结果 实验结果表明,EDFCC算法在Indian Pines和Pavia University两个高光谱数据集上的聚类精度分别达到了42.95%和60.59%,与当前流行的低秩子空间聚类算法(LRSC)相比分别提高了3%和4%,相比于基于自编码器的数据聚类算法(AEKM)分别提高了2%和3%。结论 EDFCC算法能够从高光谱图像的高维光谱信息中提取更加有效的深层特征,提升聚类精度,并且由于EDFCC算法不需要额外的训练过程,大大提升了聚类效率。  相似文献   

13.
功能超网络广泛地应用于脑疾病诊断和分类研究中,而现有的关于超网络创建的研究缺乏解释分组效应的能力或者仅考虑到脑区间组级的信息,这样构建的脑功能超网络会丢失一些有用的连接或包含一些虚假的信息,因此,考虑到脑区间的组结构问题,引入sparse group Lasso(sgLasso)方法进一步改善超网络的创建。首先,利用sgLasso方法进行超网络创建;然后,引入两组超网络特有的属性指标进行特征提取以及特征选择,这些指标分别是基于单一节点的聚类系数和基于一对节点的聚类系数;最后,将特征选择后得到的两组有显著差异的特征通过多核学习进行特征融合和分类。实验结果表明,所提方法经过多特征融合取得了87.88%的分类准确率。该结果表明为了改善脑功能超网络的创建,需要考虑到组信息,但不能逼迫使用整组信息,可以适当地对组结构进行扩展。  相似文献   

14.
提出了基于非下采样Shearlet和几何结构的遥感图像无监督变化检测新算法。首先将两幅SAR图像相减取绝对值得到差异图像,然后利用基于非下采样Shearlet自适应贝叶斯阈值去噪算法对差异图像进行去噪处理来减少噪声的影响。最后根据差异图像的局部几何特征和邻域信息构造跨特征矢量,再利用模糊C-means聚类算法对跨特征矢量聚类,聚类的结果为变化类和未变化类即最终的变化检测结果。实验证明:该算法对噪声的抗噪性能平稳而且有效,可以得到较好的检测结果。  相似文献   

15.
To make MEMS structure design in a more intuitive way, and to support the “function to 3D shape to mask” design flow, a 3D feature based structure design framework and its corresponding key enabling techniques are presented on the basis of inverse design processes and top-down design methodologies. Driven by space mapping among function and structure, the feature model and its parameters are restricted with the bond graph represented simulation model, which is constructed with functional components in simulation library at the system-level. Conforming design rules, the hierarchic feature information model is established and finally can be cascaded down to a group of 3D feature nodes, which are all silicon fabrication oriented and defined on the top of CSG/B-rep 3D solid models. Surrounding this feature information model, the 2D mask deducing and fabrication parameters extraction at the fabrication-level can be performed for manufacturability checking, design/fabrication conflict feedback and fabrication process sequence generation. Taking a micro gap-closing actuator as an example, the structure design process is demonstrated in terms of this 3D feature modeling methodology.  相似文献   

16.
随着信息的爆炸式增长,现有的搜索引擎在很多方面不能满足人们的需要。Web文档聚类可以减小搜索空间,加快检索速度,提高查询精度。提出了一种融合SOM(Self-Organizing Maps)粗聚类和改进PSO(Particle Swarm Optimization)细聚类的Web文档集成聚类算法。首先根据向量空间模型表示法,用特征词条及其权值表示Web文档信息,其次用SOM算法对文档特征集进行粗聚类,得到一组输出权值,然后用这组权值初始化改进的PSO算法,用改进PSO算法对此聚类结果进行细化,最终实现Web文档聚类。仿真结果表明,该算法能有效提高文档查询的查准率和查全率,具有一定的实用价值。  相似文献   

17.
针对现实社会中由多种表示或视图组成的多视图数据广泛存在的问题,深度矩阵分解模型因其能够挖掘数据的层次信息而备受关注,但该模型忽略了数据的几何结构信息.为解决以上问题,本文提出基于深度图正则化矩阵分解的多视图聚类算法,通过获取每个视图的局部结构信息和全局结构信息在逐层分解中加入两个图正则化限制,保护多视图数据的几何结构信...  相似文献   

18.
针对间歇过程中三维数据展开为二维造成的部分信息丢失以及数据的全局和局部结构可能发生的变化,提出一种基于张量分解的时序扩展全局局部邻域保持嵌入(TTGNPE)算法.首先利用TTGNPE算法直接处理间歇过程中的三维数据,以避免因展开为二维而造成的信息丢失;然后,将近邻流形嵌入并引入数据空间的全局和局部结构保持中,充分提取数据的局部和全局特征信息;最后,结合移动数据窗技术来处理过程的动态时变性,检测到故障后用贡献图法诊断出故障变量.通过青霉素发酵过程验证了所提出的算法对间歇过程故障检测与诊断的优越性.  相似文献   

19.
针对特征空间中存在潜在相关特征的规律,分别利用谱聚类探索特征间的相关性及邻域互信息以寻求最大相关特征子集,提出联合谱聚类与邻域互信息的特征选择算法.首先利用邻域互信息移除与标记不相干的特征.然后采用谱聚类将特征进行分簇,使同一簇组中的特征强相关而不同簇组中的特征强相异.继而基于邻域互信息从每一特征簇组中选择与类标记强相关而与本组特征低冗余的特征子集.最后将所有选中特征子集组成最终的特征选择结果.在2个基分类器下的实验表明,文中算法能以较少的合理特征获得较高的分类性能.  相似文献   

20.
针对传统谱聚类算法应用于图像分割时仅采用特征相似性信息构造相似性矩阵,而忽略了像素分布的空间临近信息的缺陷,提出一种新的相似性度量公式--加权欧氏距离的高斯核函数,充分利用图像特征相似性信息和空间临近信息构造相似性矩阵。在谱映射过程中,采用Nystrom逼近策略近似估计相似性矩阵及其特征向量,大大减少了求解相似性矩阵的运算复杂度,降低了内存消耗。对得到的低维向量子空间采用一种新型的聚类算法--近邻传播聚类算法进行聚类,避免了传统谱聚类采用K-means算法对初始值敏感,易陷入局部最优的缺陷。实验表明该算法获得了比传统谱聚类算法更好的分割效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号