首页 | 官方网站   微博 | 高级检索  
     

对称和非对称词语聚类模型的比较研究
引用本文:孙越恒,曹桂宏,侯越先. 对称和非对称词语聚类模型的比较研究[J]. 计算机工程, 2009, 35(10): 14-17
作者姓名:孙越恒  曹桂宏  侯越先
作者单位:天津大学计算机科学与技术学院,天津,300072;天津大学计算机科学与技术学院,天津,300072;天津大学计算机科学与技术学院,天津,300072
摘    要:词语聚类是语音识别、智能信息检索等领域的一个重要的自然语言处理问题。实现基于互信息的对称聚类模型,并针对该模型未考虑词语顺序的缺陷,提出一种新的非对称聚类模型。按照聚类词相对其他词语的位置关系,该模型分为2个子模型,即条件聚类模型和预测聚类模型。在大规模数据集上的实验表明,相对于对称聚类模型,非对称聚类模型是一种更为有效的词语聚类模型。

关 键 词:词语聚类  对称聚类模型  非对称聚类模型
修稿时间: 

Comparative Research on Symmetric and Asymmetric Word Clustering Models
SUN Yue-heng,CAO Gui-hong,HOU Yue-xian. Comparative Research on Symmetric and Asymmetric Word Clustering Models[J]. Computer Engineering, 2009, 35(10): 14-17
Authors:SUN Yue-heng  CAO Gui-hong  HOU Yue-xian
Affiliation:School of Computer Science and Technology;Tianjin University;Tianjin 300072
Abstract:Word clustering is one of important natural language processing issues in speech recognition and intelligent information retrieval,etc.This paper presents a symmetric clustering model based on mutual information.For the model not taking the order of words into account,it proposes a new asymmetric clustering model including two sub models,conditional clustering model and predictive clustering model.Experimental results on large scale data set show that compared with the symmetric clustering model,the asymmet...
Keywords:word clustering  symmetric clustering model  asymmetric clustering model  
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程》浏览原始摘要信息
点击此处可从《计算机工程》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号