基于大规模语料库的汉语词相似计算 The Computation of Chinese Word Similarity Based on Large Scale Corpus期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

基于大规模语料库的汉语词相似计算

引用本文：	买志玉,金澎,曾赛. 基于大规模语料库的汉语词相似计算[J]. 中原工学院学报, 2010, 21(3): 45-50. DOI: 10.3969/j.issn.1671-6906.2010.03.013

作者姓名：	买志玉金澎曾赛

作者单位：	1. 中原工学院,郑州,450007 2. 乐山师范学院,四川,乐山,614004

摘要：	针对词语相似度这一问题,在大规模语料库上,通过分布相似对汉语词相似进行了研究.实现了一个词相似计算平台,可灵活组合各种计算词相似算法,新增加语料库可以被增量式用于计算;对比研究了基于距离的度量和基于概率的度量2类算法的性能,通过和人工创建的黄金标准进行比较,基于概率的度量算法要优于基于距离的度量算法.
关键词：	自然语言处理词相似分布相似度
The Computation of Chinese Word Similarity Based on Large Scale Corpus

MAI Zhi-yu,JIN Peng,ZENG Sai. The Computation of Chinese Word Similarity Based on Large Scale Corpus[J]. Journal of Zhongyuan Institute of Technology, 2010, 21(3): 45-50. DOI: 10.3969/j.issn.1671-6906.2010.03.013

Authors:	MAI Zhi-yu JIN Peng ZENG Sai

Abstract:

Keywords:
本文献已被 CNKI 维普万方数据等数据库收录！