首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 171 毫秒
1.
在使用K-Means进行文本聚类的研究中,针对K-Means算法缺点,提出了利用DBSACN算法确定参数K的方法,将基于密度的聚类算法应用于特征选取上,使得K值计算有了一定的确定性,从而提高了聚类质量。这种将多种算法混合运用的方法,为文本聚类算法的设计提供一个新的方向。  相似文献   

2.
一个基于K-means的聚类算法的实现   总被引:9,自引:0,他引:9  
聚类算法作为数据挖掘中的一种分析方法,它能找到样本比较密集的部分,并且概括出样本相对比较集中的区域.分析了传统的聚类算法及局限性,讨论了一个基于K-mealls算法的实现过程,使得算法可处理存在孤立点的大文档集,得到最佳的聚类结果。  相似文献   

3.
K-Means聚类算法在面对海量数据时,时间和空间的复杂性已成为K-Means聚类算法的瓶颈.在充分研究传统K-Means聚类算法的基础上,提出了基于集群环境的并行K-Means聚类算法的设计思想,给出了其加速比估算公式,并通过实验证明了该算法的正确性和有效性.  相似文献   

4.
K-Means算法是划分式聚类算法。本文通过在应用中的编程实现分析了基于欧式距离的划分式聚类算法的基本原理、实现步骤和编程时的注意事项,最后分析了该算法的优缺点。  相似文献   

5.
基于聚类法的协同神经网络学习算法   总被引:11,自引:1,他引:11  
根据协同学理论的基本观点(模式识别的过程即为模式形成的过程),对构造出的协同神经网络在模式识别中的应用进行了研究.发现伴随向量的性能直接影响到模式识别的成功率,而伴随向量是由原型向量计算得到.所以原型向量的选择对识别结果有着十分重要的作用.提出了一种基于聚类算法的选择原型向量的方法.通过对近千个样本进行的模拟实验,结果证明这种基于聚类算法的原型向量选择方法很有效,使识别率有了较大的提高.  相似文献   

6.
为有效地利用日志文件,更有深度地刻画学习者画像,提出了双路聚类建模方法(Two-way Clustering, TWC),分析挖掘了万余人次学习者在某大学网络教育学院的大量学习行为数据,力图更深刻地展现远程教育学习者的风貌. 考虑到教育数据具有隐含性这一特点,该方法以细粒度数据为核心,通过双角度的聚类计算得到了各学习者在不同模型中的类别,最后基于融合后的模型对学习者进行刻画. 4种经典聚类算法与TWC算法的对比实验结果和TWC算法的聚类结果表明:TWC算法能够增强簇的内聚性,更准确地对学习者进行聚类,从而更深刻、更全面地刻画学习者轮廓.  相似文献   

7.
黄金花 《科技信息》2008,(13):254-254
本文介绍了聚类算法基本原理以及各种常用的聚类算法,并比较分析了几种典型聚类算法的优点与不足。以便于对聚类算法作进一步的研究。  相似文献   

8.
通过分析国内外读者行为分析算法的优缺点,提出了一种基于灰狼优化聚类算法的读者行为分析算法.首先,通过灰狼优化算法自动寻优找到模糊C均值聚类算法的最佳初始聚类中心点,再对该初始聚类中心点进行迭代计算,得到最终聚类结果.读者借阅行为数据实验分析结果验证了灰狼优化聚类算法要优于普通的聚类算法.  相似文献   

9.
传统流形学习算法虽然是一种常用的有效降维方法,但由于其自身计算结构的限制,往往存在数据分析不足和计算时间较长等问题.为此提出一种基于谱聚类的流形学习算法(spectralclustering locally linear embedding,SCLLE),并对其机理以及优点给予了实例证明.在UCI和NCBI数据集上的实验结果表明,该算法具有较好的识别效果和计算性能.  相似文献   

10.
基于Relief算法的特征学习聚类   总被引:3,自引:0,他引:3  
聚类作为数据挖掘常用工具之一,是按照事物间的相似性进行的一种无监督分类.然而传统的聚类方法较少考虑特征权值.为此,通过研究、分析Relief算法及其在聚类应用中存在的问题,提出了一种基于Relief算法的特征评价函数,并将此函数运用到特征学习聚类中,以解决特征权值取值不当对聚类产生的负面影响.  相似文献   

11.
为了有效处理企业越来越多的业务数据,为企业业务提升和用户价值挖掘提供积极帮助,将机器学习方法应用于某运营商客户业务数据处理过程。首先对原始数据进行预处理,去除重复值、缺失值、异常值,并进行标准化处理,然后对不平衡数据采用合成少数类过采样(synthetic minority over-sampling technique, SMOTE)技术进行过采样,减少了预测的偏差。对处理后数据分别建立传统神经网络模型、优化神经网络模型和随机森林模型,并通过结构调优和参数调优等进行模型优化,对运营商客户进行预测与分析。结果表明,优化后的模型预测准确率可达96%,有良好的客户预测与分析效果,可见优化模型的有效性。最后为运营商挽留流失客户、维系非流失客户提供了解决方案,为运营商实施精准营销、节省运营商营销成本和创造更多利润提供了技术支持。  相似文献   

12.
随着网络技术和相关学科的发展,入侵检测技术日趋成熟.对SOM算法和K-Means算法进行了具体的分析,提出了一种基于SOM和K-Means的使两类算法优点相结合并克服各自不足的聚类算法,提高了聚类信息的精确度、对攻击的识别率和系统的整体性能.  相似文献   

13.
将神经网络与数据集的密度指标结合起来提出一种山峰-减法聚类神经网络方法,利用数据集的密度指标对基类进行合并,并不断重复直至产生足够多的聚类中心,就可完成对聚类神经元的学习。给出该聚类的神经元模型和学习算法。该方法的主要优点是对于工程应用中的大样本集分类和重叠数据的模式分类问题,显得非常有效。  相似文献   

14.
一种基于密度的聚类算法实现   总被引:1,自引:0,他引:1  
基于密度的聚类算法OPTICS是一种大规模数据库的聚类算法,它是基于核心对象和可达距离来实现的.对于每一个核心对象将其邻域内的所有对象按到该核心对象的可达距离进行排序,每次都选择1个到该核心对象具有最小的可达距离的对象进行信息更新.算法实现采用优先队列保存候选对象以加快处理速度,最后用UCI数据集对算法进行聚类效果测试,结果表明OPTICS算法对数据集产生一个基于密度的簇排序结构.  相似文献   

15.
模糊C-均值聚类分析系统设计与实现   总被引:3,自引:0,他引:3  
采用模糊C-均值技术设计了工业监控数据聚类分析系统,给出了聚类算法及实现步骤,采用VC++程序来实现,通过.实验测试和实例数据分析,表明该聚类算法针对工业监控数据存在不确定性、有噪声及多模态性等特点有较好的鲁棒性和适应性。  相似文献   

16.
一种基于密度的引力聚类算法   总被引:1,自引:0,他引:1  
针对传统基于距离的聚类算法所存在的缺点,将万有引力和牛顿第二运动定律思想引入到聚类过程中,提出了一种改进的基于密度的引力聚类算法GCABD.该算法可以自动决定目标数据集中的簇的个数,并且能发现任意形状的簇且可以过滤"噪声"数据.实验结果表明,所提出的GCABD算法的聚类效果和精度均比典型的K-means算法好,提高了聚类质量.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号