首页 | 官方网站   微博 | 高级检索  
     

基于遗传算法的自适应文本模糊聚类研究
引用本文:戴文华,焦翠珍,何婷婷.基于遗传算法的自适应文本模糊聚类研究[J].计算机科学,2008,35(8):134-137.
作者姓名:戴文华  焦翠珍  何婷婷
作者单位:1. 成宁学院计算机系,成宁,437100
2. 华中师范大学计算机科学系,武汉,430079
基金项目:国家自然科学基金,国家社会科学基金,教育部科研项目,湖北省教育厅科研项目
摘    要:针对FCM聚类算法时初始聚类中心的选择敏感,以及聚类数C难以确定的问题,提出一种基于遗传算法的自适应文本模糊聚类方法.该方法首先将文档集合表示成向量空间模型,并采用一种新型的可变长染色体编码方案,随机选择文本向量作为初始聚类中心形成染色体,然后结合FCM算法的高效性和遗传算法的全局优化能力,通过遗传进化,有效地避免了局部最优解的出现,同时得到了优化的聚类数目和聚类结果.实验表明该算法是一种精确高效的文本聚类方法.

关 键 词:遗传算法  FCM聚类  文本聚类  模糊聚类

Research on Adaptive Text Fuzzy Clustering Based on Genetic Algorithm
DAI Wen-hua,JIAO Cui-zheng,HE Ting-ting.Research on Adaptive Text Fuzzy Clustering Based on Genetic Algorithm[J].Computer Science,2008,35(8):134-137.
Authors:DAI Wen-hua  JIAO Cui-zheng  HE Ting-ting
Affiliation:DAI Wen-hua1 JIAO Cui-zheng1 HE Ting-ting2(Department of Computer,Xianning College,Xianning 437100,China)1(Department of Computer Science,Central China Normal University,Wuhan 430079,China)2
Abstract:As Fuzzy C-means Clustering Algorithm was sensitive to the choice of the initial cluster centers and it's difficult to determine the cluster number,we proposed an Adaptive Text Fuzzy Clustering Method Based on Genetic Algorithm.According to the principle of Vector Space Model,documents were represented as vectors.Then we adopted a new strategy of variable-length chromosome encoding and randomly chose initial clustering centers to form chromosomes among document vectors.Combining the efficiency of Fuzzy C-me...
Keywords:Genetic algorithm  Fuzzy C-means clustering  Text clustering  Fuzzy clustering  
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机科学》浏览原始摘要信息
点击此处可从《计算机科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号