首页 | 官方网站   微博 | 高级检索  
     

一种快速词自动聚类算法
引用本文:王舵,郄君,张娟,李文斌.一种快速词自动聚类算法[J].计算机应用与软件,2010,27(8).
作者姓名:王舵  郄君  张娟  李文斌
作者单位:1. 中共石家庄市委党校,河北,石家庄,050051
2. 河北政法职业学院,河北,石家庄,050061
3. 石家庄经济学院,河北,石家庄,050031
摘    要:词聚类是语言自动处理中一个重要的基础环节.传统的统计方法基于贪婪原则,常以语料的似然函数或困惑度作为评价标准,其主要缺点是:聚类速度慢、初值对结果的影响大、易陷入局部最优.针对这些问题,提出了基于相似度测度和覆盖方法的聚类方法.该方法计算量小、聚类速度快.而且,借助覆盖原理有效减小了初始点选取对聚类的影响程度.实验证明,效果理想.

关 键 词:词聚类  似然函数  覆盖方法

A NEW ALGORITHM OF WORDS AUTOMATIC CLUSTERING
Wang Duo,Qie Jun,Zhang Juan,Li Wenbin.A NEW ALGORITHM OF WORDS AUTOMATIC CLUSTERING[J].Computer Applications and Software,2010,27(8).
Authors:Wang Duo  Qie Jun  Zhang Juan  Li Wenbin
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号