首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
为了研究数据挖掘技术在过程工业数据中的应用,采用基于Bayes原理的AutoClass聚类算法,对炼油厂常减压装置实际生产数据进行了聚类分析处理。结果表明,经过聚类分析可以从历史数据记录中提取清晰的类别信息,其中包含有用的知识。同时还通过对比实验,分析了多个聚类参数对结果的影响及原因。最后分析了聚类结果,讨论了应用该结果的方法。  相似文献   

2.
章永来  周耀鉴 《计算机应用》2019,39(7):1869-1882
大数据时代,聚类这种无监督学习算法的地位尤为突出。近年来,对聚类算法的研究取得了长足的进步。首先,总结了聚类分析的全过程、相似性度量、聚类算法的新分类及其结果的评价等内容,将聚类算法重新划分为大数据聚类与小数据聚类两个大类,并特别对大数据聚类作了较为系统的分析与总结。此外,概述并分析了各类聚类算法的研究进展及其应用概况,并结合研究课题讨论了算法的发展趋势。  相似文献   

3.
聚类分析方法有多种,其中的模糊聚类应用最为广泛.简单介绍模糊聚类的发展历程和模糊聚类的几种常用算法,其中重点分析布尔矩阵法和最大树法两种模糊聚类分析算法,并用标准数据集对它们分别进行聚类分析和比较.  相似文献   

4.
针对聚类分析算法在数据挖掘应用中存在的问题,该文结合遗传算法,对传统K均值聚类算法进行了改进,提出了混合类型数据聚类新算法,扩展了聚类分析的应用范围。实验结果表明,该算法具有较好的聚类性能。  相似文献   

5.
对某通信服务股份有限公司3年内的创新数据摘要分别进行词云分析和LDA主题挖掘,分别得到词云图和聚类主题,聚类主题主要是核心关键技术的主题聚类结果。对创新数据的名称进行LDA聚类分析,聚类结果与摘要聚类结果进行综合,得到最终聚类主题分析结果。由于词云和聚类主题并不能直接得出技术所应用的行业,对具有代表性的两个公司的创新数据进行行业分析,发现目前应用于制造业的技术主要为工业互联网应用以及生产线产品检测。得出高技术(服务业)主要通过提升自身的数字化、智能化以及技术创新助推制造业朝着服务化、数字化或智能化、绿色化发展。  相似文献   

6.
系统聚类法是聚类分析中应用最广泛的一种方法,凡是具有系统聚类分析数值特征的变量和样品都可以采用系统聚类法,选择不同的距离和聚类方法可获得满意的数值分类效果。该文将应用系统聚类法通过客户数据对银行营销进行分析,分类的目的是银行的客户群进行分类。  相似文献   

7.
聚类分析技术能使人脸识别系统了解人脸特征数据的分布方式,并为人脸数据库建立适当的索引结构.目前缺乏对真实人脸数据进行聚类分析的工作,为弥补不足,此文探索了Cure聚类算法在人脸识别中的应用.在分析过各种影响聚类效果的因素,如高维人脸特征数据对聚类效果的影响、Cure算法的缺点等,对Cure算法提出了若干改进.  相似文献   

8.
一种增量式模糊聚类算法   总被引:5,自引:2,他引:5  
随着数据库中数据的迅速增长,新增数据对聚类结果有很大影响,而重新聚类势必严重浪费计算资源。本文提出了一种增量式的模糊聚类算法,合理地解决了新增数据对象的聚类及类属问题,并应用实例说明了新老算法具有同样的可靠性,但新算法大大提高了聚类分析与知识维护的效率。  相似文献   

9.
针对传统聚类算法难以高效进行海量数据聚类分析的问题,提出一种基于MapReduce框架的K-means聚类集成算法。利用K-means算法生成不同聚簇数目的基聚类结果,改进共协关系矩阵,依据数据点对出现次数进行集成,自动得出最终聚类结果。实验结果表明,该算法能够有效地改善聚类质量,具有良好的扩展性,适用于海量数据的聚类分析。  相似文献   

10.
聚类分析是一种无监督的机器学习方法,聚类结果完全取决于所用聚类算法,不同的算法会得到不同的聚类结果,因此面对待挖掘数据选择合适的算法很重要。如何判断哪个聚类算法最合适,或者哪个算法的聚类结果最优,就需要用到聚类评价方法。本文选择各类聚类算法中的经典算法对某汽车4S店顾客消费数据进行聚类分析,最后用两种评价指标对各聚类结果进行评价进而选择出最优的聚类算法。  相似文献   

11.
基于遗传算法及聚类的基因表达数据特征选择   总被引:1,自引:0,他引:1  
特征选择是模式识别及数据挖掘等领域的重要问题之一。针对高维数据对象(如基因表达数据)的特征选择,一方面可以提高分类及聚类的精度和效率,另一方面可以找出富含信息的特征子集,如发现与疾病密切相关的重要基因。针对此问题,本文提出了一种新的面向基因表达数据的特征选择方法,在特征子集搜索上采用遗传算法进行随机搜索,在特征子集评价上采用聚类算法及聚类错误率作为学习算法及评价指标。实验结果表明,该算法可有效地找出具有较好可分离性的特征子集,从而实现降维并提高聚类及分类精度。  相似文献   

12.
裘国永  张娇 《计算机应用研究》2012,29(10):3685-3687
分析和研究了自适应降维算法在高维数据挖掘中的应用。针对已有数据挖掘算法因维灾难导致的在处理高维数据时准确率和聚类质量都较低的情况,将二分K-均值聚类和SVM决策树算法结合在一起,提出了一种适用于高维数据聚类的自适应方法 BKM-SVMDT。该算法能保证二分K-均值聚类是在低维数据空间中进行,其结果再反过来帮助SVM在高维空间中的执行,这样反复执行以取得较好的分类精度和效率。标准数据集的实验结果证明了该方法的有效性。  相似文献   

13.
基于聚类和分类的自学习系统模型   总被引:5,自引:0,他引:5  
论文在分析聚类与分类方法的基础上,尝试将这两种独立的开采方法集成起来,使两种开采方法能够相得益彰。由此建立的知识发现系统能自动利用已有知识进行分类,同时可较为准确地估计聚类分析所必需的参数,并通过聚类分析来发现和修正错误知识。论文给出了集成方法和实验结果,最后对该集成算法的性能进行了分析。  相似文献   

14.
随着数据挖掘技术的日趋成熟,其在生活中的作用也越来越重要。本文首先介绍了数据挖掘,聚类分析和分类分析的相关知识,然后将层次聚类应用到分类规则挖掘中。  相似文献   

15.
目前,多尺度数据挖掘的研究多集中于空间图像数据,在一般数据集上的研究已经初见成果,主要包括多尺度聚类以及多尺度关联规则,但 还没有研究涉及 一般数据下的分类。结合分形理论思想,将多尺度数据挖掘相关理论、知识和方法应用于分类领域,提出基于豪斯多夫距离(HD)的相似性度量方法;相对于以往对权重的经验定义,文中明确通过广义分形维数的相似性定义权重来提高相似性度量方法的精度;提出多尺度分类尺度上推算法(Multi-Scale Classification Scaling-Up Algorithm,MSCSUA);实验采用4个UCI基准数据集和1个真实数据集(H省部分人口)进行仿真实验,实验结果表明多尺度分类思想可行有效,并且MSCSUA算法在不同数据集上的性能均优于SLAD,KNN,Decision Tree以及LIBSVM算法。  相似文献   

16.
利用SAS数据挖掘软件和SQL Server2000构成的数据挖掘模型对读者数据进行聚类分析,通过TREE过程将聚类结果以树状图的形式展示出来,得到读者群体的分类并依据分类为读者提供个性化服务。  相似文献   

17.
数据挖掘在电信客户关系管理的应用   总被引:1,自引:0,他引:1  
本文介绍了数据挖掘的相关概念与知识,提出了数据挖掘在当今从海量数据中提取相关信息,和知识发现的过程,与此同时介绍了数据挖掘在帮助企业进行数据分析,推理,预测的应用,例如:关联分析、时序模式、偏差分析、分类、聚类、预测等。与此同时,着重提出了数据挖掘在电信行业营销的应用,介绍了国内外应用现状,并以国内某电信运营商的数据仓库项目为例,例证了数据挖掘在客户分群和流失预测的成功应用,在此基础上,展望了未来的可发展方向。  相似文献   

18.
社交网络数据的高度复杂性给数据挖掘研究带来了巨大的挑战,而社交网络数据挖掘更注重实体之间相互关联的特点,使得图数据挖掘技术的研究与应用逐渐成为该领域的热点。传统数据挖掘,如聚类、分类、频繁模式挖掘等技术逐渐拓展到图数据挖掘领域。文中首先介绍了现阶段图数据挖掘算法(其中包括图查询、图聚类、图分类和图的频繁子图挖掘)的研究内容和存在的问题;其次介绍了图形数据库研究现状,以及对比了主流图形数据库管理系统的优劣;最后介绍了图挖掘技术在社交网络中的应用。  相似文献   

19.
基于数据挖掘的入侵检测系统由于引入了数据挖掘技术,很好的解决了传统入侵检测系统中自适应性和扩展性的问题。在数据挖掘中.聚类分析和分类分析是重要的技术,该文将这两种技术引入入侵检测模型,提出了一种基于聚类的分类分析自适应入侵检测模型。  相似文献   

20.
概念漂移数据流挖掘算法综述   总被引:1,自引:0,他引:1  
丁剑  韩萌  李娟 《计算机科学》2016,43(12):24-29, 62
数据流是一种新型的数据模型,具有动态、无限、高维、有序、高速和变化等特性。在真实的数据流环境中,一些数据分布是随着时间改变的,即具有概念漂移特征,称为可变数据流或概念漂移数据流。因此处理数据流模型的方法需要处理时空约束和自适应调整概念变化。对概念漂移问题和概念漂移数据流分类、聚类和模式挖掘等内容进行综述。首先介绍概念漂移的类型和常用概念改变检测方法。为了解决概念漂移问题,数据流挖掘中常使用滑动窗口模型对新近事务进行处理。数据流分类常用的模型包括单分类模型和集成分类模型,常用的方法包括决策树、分类关联规则等。数据流聚类方式通常包括基于k- means的和非基于k- means的。模式挖掘可以为分类、聚类和关联规则等提供有用信息。概念漂移数据流中的模式包括频繁模式、序列模式、episode、模式树、模式图和高效用模式等。最后详细介绍其中的频繁模式挖掘算法和高效用模式挖掘算法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号