首页 | 官方网站   微博 | 高级检索  
     

基于模糊粒度计算的文本聚类研究
引用本文:张霞,尹怡欣,于海燕,赵海龙.基于模糊粒度计算的文本聚类研究[J].计算机工程与应用,2010,46(13):53-55.
作者姓名:张霞  尹怡欣  于海燕  赵海龙
作者单位:1. 北京科技大学信息工程学院,北京100083;河北经贸大学计算机中心,石家庄050061
2. 北京科技大学信息工程学院,北京,100083
基金项目:国家自然科学基金No.60374032;;河北省教育厅科研计划项目No.2009116~~
摘    要:典型的文本聚类算法是一种硬划分,但是实际上由于中文文本的多样性和大量性更适合进行软划分,模糊集理论的提出为这种软划分提供了有力的分析工具。传统的模糊聚类方法大都是通过对隶属度的矩阵逐步迭代得到模糊等价矩阵或模糊划分的方法实现聚类,这个过程需要大量的存储空间。基于模糊粒度计算的文本聚类算法是在文档集合的模糊粒度空间上给定一个归一化的距离函数ddidj),对距离小于粒度dλ的文本进行动态聚类。通过实验证明此方法在解决文本聚类问题时具有降低计算复杂度和空间复杂度,适于大量文本的聚类处理。

关 键 词:模糊  粒度计算  文本聚类  归一化距离函数
收稿时间:2009-3-6
修稿时间:2009-4-21  

Research of text clustering based on fuzzy granular computing
ZHANG Xia,YIN Yi-xin,YU Hai-yan,ZHAO Hai-long.Research of text clustering based on fuzzy granular computing[J].Computer Engineering and Applications,2010,46(13):53-55.
Authors:ZHANG Xia  YIN Yi-xin  YU Hai-yan  ZHAO Hai-long
Affiliation:1.School of Information Engineering,University of Science and Technology Beijing,Beijing 100083,China 2.Computer Center,Hebei University of Economics and Business,Shijiazhuang 050061,China
Abstract:The typical algorithm of text clustering is aHard Partitionone.Actually,Chinese text is better to treat withSoft Partitionfor its diversity and largeness.The fuzzy-set theory supplies a powerful analyzing tool to thisSoft partition.Traditional fuzzy text clustering methods mostly get the fuzzy equivalent matrix or fuzzy division by iterating the matrix of membership degree.Huge storage space is necessary for that process.The text clustering based on fuzzy granular computing will work as:First a normalized d...
Keywords:fuzzy  granular computing  text cluster  normalized distance function
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程与应用》浏览原始摘要信息
点击此处可从《计算机工程与应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号