首页 | 官方网站   微博 | 高级检索  
     

基于稀疏差异度的聚类方法在信息分类中的应用
引用本文:尹松,周永权,李陶深.基于稀疏差异度的聚类方法在信息分类中的应用[J].微机发展,2006,16(1):117-119.
作者姓名:尹松  周永权  李陶深
作者单位:广西大学计算机与电子信息学院 广西南宁530004(尹松,李陶深),广西民族学院计算机与信息科学学院 广西南宁530006(周永权)
摘    要:针对文本信息聚类中的高属性维稀疏数据聚类问题,采用计算对象间稀疏特征差异度来度量文本对象之间的相关度,结合最小生成树的方法来进行聚类分析,提出一种基于稀疏特征差异度的聚类方法。通过实例表明,该算法对于多关键字匹配的文本信息分类十分有效,并可根据关键字的重要程度进行加权计算,使聚类更加符合实际情况。该算法将在高维稀疏数据挖掘中有着重要应用。

关 键 词:聚类分析  稀疏特征  差异度  最小生成树
文章编号:1005-3751(2006)01-0117-03
修稿时间:2005年4月4日

Research of Sparse Feature Difference-Based Clustering Method Applied to Information Classifying
YIN Song,ZHOU Yong-quan,LI Tao-shen.Research of Sparse Feature Difference-Based Clustering Method Applied to Information Classifying[J].Microcomputer Development,2006,16(1):117-119.
Authors:YIN Song  ZHOU Yong-quan  LI Tao-shen
Affiliation:YIN Song~1,ZHOU Yong-quan~2,LI Tao-shen~1
Abstract:The sparse feature difference degree and the minimum cost spanning tree are used to resolve the problem of high attribute dimensional data clustering which exists in information classifying,in order to support the central idea,an example is given in the paper.The algorithm is very efficient when a lot of key words need to be matched in information classifying,and it also can consider the different importance of the keywords,so the algorithm can get an objective result,and it will be very important in high attribute dimensional data mining.
Keywords:clustering analysis  sparse feature  difference degree  minimum cost spanning tree
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号