首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到14条相似文献,搜索用时 93 毫秒
1.
王玲  吴璐璐  付冬梅 《工程科学学报》2014,36(11):1560-1565
针对密度聚类算法对邻域参数设置敏感的问题,提出一种基于密度的模糊自适应聚类算法.算法在无需预先设置聚类数以及邻域参数的情况下,可以自适应地根据样本间距离关系确定邻域半径得到样本密度,并根据样本密度逐渐增加聚类中心.为了保障聚类结果的正确性,同时提出一种新的模糊聚类有效性指标以判断最佳聚类数,消除了密度聚类算法对参数的敏感性.用UCI基准数据集进行实验,发现本文算法在对数据进行聚类时,聚类质量较原始密度聚类算法在准确性和自适应性方面均有显著提高.  相似文献   

2.
李锐利 《山西冶金》2010,33(3):31-32,66
介绍了数据挖掘对聚类分析方法提出的要求和聚类分析方法的分类及其代表性的主要算法,并对算法进行了性能比较。  相似文献   

3.
武森  姜丹丹  王蔷 《工程科学学报》2016,38(7):1017-1024
CABOSFV_C是一种针对分类属性高维数据的高效聚类算法,该算法采用集合稀疏差异度进行距离计算,并采用稀疏特征向量实现数据压缩.该算法的聚类效果受集合稀疏差异度上限参数的影响,而该参数的选取没有明确的指导.针对该问题提出基于集合稀疏差异度的启发式分类属性数据层次聚类算法(heuristic hierarchical clustering algorithm of categorical data based on sparse feature dissimilarity,HABOS),该方法从聚结型层次聚类思想的角度出发,在聚类数上限参数的约束下,应用新的内部聚类有效性评价指标(clustering validation index based on sparse feature dissimilarity,CVISFD)进行启发式度量,从而实现对聚类层次的自动选取.UCI基准数据集的实验结果表明,HABOS有效地提高了聚类准确性和稳定性.  相似文献   

4.
针对经典K–means算法对不均衡数据进行聚类时产生的“均匀效应”问题,提出一种基于近邻的不均衡数据聚类算法(Clustering algorithm for imbalanced data based on nearest neighbor,CABON)。CABON算法首先对数据对象进行初始聚类,通过定义的类别待定集来确定初始聚类结果中类别归属有待进一步核定的数据对象集合;并给出一种类别待定集的动态调整机制,利用近邻思想实现此集合中数据对象所属类别的重新划分,按照从集合边缘到中心的顺序将类别待定集中的数据对象依次归入其最近邻居所在的类别中,得到最终的聚类结果,以避免“均匀效应”对聚类结果的影响。将该算法与K–means、多中心的非平衡K_均值聚类方法(Imbalanced K–means clustering method with multiple centers,MC_IK)和非均匀数据的变异系数聚类算法(Coefficient of variation clustering for non-uniform data,CVCN)在人工数据集和真实数据集上分别进行实验对比,结果表明CABON算法能够有效消减K–means算法对不均衡数据聚类时所产生的“均匀效应”,聚类效果明显优于K–means、MC_IK和CVCN算法。   相似文献   

5.
武森  王蔷  姜敏  魏青 《工程科学学报》2013,35(8):1093-1098
针对部分聚类算法对数据输入顺序敏感的问题,定义了不干涉序列指数,提出了应用不干涉序列指数对分类数据进行加权排序的方法,并基于该方法对受数据输入顺序影响的CABOSFV_C分类数据高效聚类算法进行改进,提出了考虑加权排序的聚类算法(CABOSFV_CSW),消除了算法对数据输入顺序的敏感性.采用UCI基准数据集进行实验,发现应用加权升序排序的CABOSFV_CSW算法在处理分类数据时,聚类质量较原始CABOSFV_C算法和其他受数据输入顺序影响的算法在准确性上有改善,在稳定性上有显著提高.  相似文献   

6.
为了建立工业污水pH值中和系统的正模型,研究了具有大滞后非线性特性的加药中和过程。利用一种动态自适应最近邻聚类(DANNC)学习算法,全面调整网络参数完成了污水pH值加药中和控制系统网络的学习和训练。采用中和过程神经网络内模控制系统的逆模型充当控制器,进行了各种工业条件下污水中和的仿真实验。结果表明,该系统实现了△pH≤0.2的工业污水的控制精度目标,系统实时跟踪和抗干扰性良好。  相似文献   

7.
工业监控系统所采集到的多元时间序列在利用数据挖掘技术获取内部存在的未知模式的过程中,经常会出现原始数据庞杂、分段结果重复、交集过多和界限不清晰等问题,导致含有突变变量或数据间相关性差的数据集进行模式挖掘结果不理想.针对上述问题,本文提出了一种新的多元时序模糊聚类分段挖掘算法.实验结果表明,该算法克服了Gath-Geva算法聚类精度易受初始值影响的不足,能够较好地反映出原始数据中潜在的过程变化,从而有效地处理时间序列的分段问题并得到理想的挖掘结果.  相似文献   

8.
鲁杰  闫炳基  赵伟  李鹏  陈栋  国宏伟 《工程科学学报》2022,44(12):2081-2089
高炉操作炉型与高炉操作、技术经济指标等关系密切,合理的操作炉型有利于保证高炉生产的优质、低耗、高产、长寿.通过对冷却壁温度的聚类分析,能够有效合理地表征高炉操作炉型的变化,对高炉生产有着重要的指导意义.分别采用K-Means、TwoStep对数据集进行聚类分析,基于两种聚类算法的原理,结合Davies-Bouldin index(DBI)与Dunn index(DI)对聚类结果进行评价,分析不同聚类算法间的差异,得出了在所选样本数据及数据特征基础上,K-Means算法聚类结果更好的结论,该研究可为高炉炼铁大数据分析中的聚类算法选择提供有力参考.  相似文献   

9.
在非结构化数据挖掘结构模型——发现特征子空间模型(DFSSM)——的运行机制下,提出了一种新的Web文本聚类算法——基于DFSSM的Web文本聚类(WTCDFSSM)算法.该算法具有自稳定性,无须外界给出评价函数;能够识别概念空间中最有意义的特征,抗噪声能力强.结合现代远程教育网应用背景实现了WTCDFSSM聚类算法.结果表明:该算法可以对各类远程教育站点上收集的文本资料信息自动进行聚类挖掘;采用网格结构模型,帮助人们进行文本信息导航;从海量文本信息源中快速有效地获取重要的知识.  相似文献   

10.
为了实现对电弧炉冶炼过程碳质量分数的预测,根据炼钢过程的碳氧反应机理建立电弧炉脱碳模型。在此基础上采用数据挖掘技术中的k-means聚类算法对电弧炉炼钢历史数据进行分析,选取8个影响终点碳质量分数的因素,得出不同冶炼情况下的聚类结果。通过计算当前炉次与聚类结果加权欧氏距离,将相似度高的聚类结果炉次作为当前炉次的预测参考炉次,最终实现对电弧炉终点碳质量分数的预测。仿真结果表明钢水碳质量分数预报的命中率在75%以上,模型具有较高的预报精度。  相似文献   

11.
提出基于集合差异度的聚类算法.算法通过定义的集合差异度和集合精简表示,直接进行一个集合内所有对象总体差异程度的计算,而不必计算两两对象间的距离,并且在不影响计算精确度的情况下对分类属性高维数据进行高度压缩,只需一次数据扫描即得到聚类结果.算法计算时间复杂度接近线性.实例表明该算法是有效的.  相似文献   

12.
提出了一种适用于多镜像站点环境下的分布式Web使用聚类局部挖掘算法LUC和全局挖掘算法GUC,较好地解决了Web访问信息的异地存储、分布式算法通讯量等因素给模式分析过程带来的困难.将给出的算法用Java语言加以实现,并对算法性能进行了研究.结果证明,该算法是有效的,可以用来高效、准确地在多镜像站点环境下发现Web用户群体模式.  相似文献   

13.
针对钢管入库优化决策问题,建立了问题的约束满足优化模型,并通过对垛高和钢管堆放规则的分析,提出了基于聚类和约束满足技术的两阶段求解算法.算法在第一阶段采用聚类的方式对待入库的钢管按照多重属性进行分组;在第二阶段利用约束满足技术对于每组钢管分别指派垛位及其在垛位上的具体位置,并通过约束传播动态缩减问题的搜索空间.最后将算法与经典的BFD (best fit deceasing)算法进行实验结果对比.实验结果表明,算法能够在保证倒垛次数最小的前提下,有效减少垛位数并具有良好的垛位利用率,模型及算法可行、有效.  相似文献   

14.
为了解决基于Apriori的分类关联规则算法挖掘数值型数据时效率和准确率偏低的问题,提出基于定量关联规则树的分类及回归预测算法.采用改进的定量关联规则算法挖掘数值型数据生成关联规则库,并基于关联规则树结构实现分类及回归预测.研究结果表明:改进的Apriori定量关联规则挖掘算法提高了分类预测的准确率并降低了计算复杂度;而采用关联规则树结构可使分类与回归预测时间明显加快,提高了样本匹配学习的速度.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号