首页 | 官方网站   微博 | 高级检索  
     

基于大规模语料库的汉语词相似计算
引用本文:买志玉,金澎,曾赛. 基于大规模语料库的汉语词相似计算[J]. 中原工学院学报, 2010, 21(3): 45-50. DOI: 10.3969/j.issn.1671-6906.2010.03.013
作者姓名:买志玉  金澎  曾赛
作者单位:1. 中原工学院,郑州,450007
2. 乐山师范学院,四川,乐山,614004
摘    要:针对词语相似度这一问题,在大规模语料库上,通过分布相似对汉语词相似进行了研究.实现了一个词相似计算平台,可灵活组合各种计算词相似算法,新增加语料库可以被增量式用于计算;对比研究了基于距离的度量和基于概率的度量2类算法的性能,通过和人工创建的黄金标准进行比较,基于概率的度量算法要优于基于距离的度量算法.

关 键 词:自然语言处理  词相似  分布相似度

The Computation of Chinese Word Similarity Based on Large Scale Corpus
MAI Zhi-yu,JIN Peng,ZENG Sai. The Computation of Chinese Word Similarity Based on Large Scale Corpus[J]. Journal of Zhongyuan Institute of Technology, 2010, 21(3): 45-50. DOI: 10.3969/j.issn.1671-6906.2010.03.013
Authors:MAI Zhi-yu  JIN Peng  ZENG Sai
Abstract:
Keywords:
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号