首页 | 官方网站   微博 | 高级检索  
     

唐宋诗中词汇语义相似度的统计分析及应用
引用本文:胡俊峰,俞士汶.唐宋诗中词汇语义相似度的统计分析及应用[J].中文信息学报,2002,16(4):40-45.
作者姓名:胡俊峰  俞士汶
作者单位:胡俊峰(北京)       俞士汶(北京)
基金项目:国家社会科学基金项目 (98BYY0 2 2 ),北京大学 985项目
摘    要:基于上下文的词汇向量空间模型可以用来近似地描述词汇的语义。在此基础上定义的词汇相似关系或聚类关系可以应用于词典编纂、智能搜索引擎的开发等许多领域。本研究基于640万字的唐宋诗语料。在进行多字词计算机辅助提取的基础上,定义了相应的词汇语义的统计表达。建立了词汇相似关系的语义网络。开发了具有词义联想功能的面向概念的唐宋诗搜索引擎。实验表明,达到了接近实用的水平。

关 键 词:词义相似度  词义联想  概念检索  唐宋诗  

Word Meaning Similarity Analysis in Chinese Ancient Poetry and Its Applications
Hu Jun,feng,Yu Shi,wen.Word Meaning Similarity Analysis in Chinese Ancient Poetry and Its Applications[J].Journal of Chinese Information Processing,2002,16(4):40-45.
Authors:Hu Jun  feng  Yu Shi  wen
Affiliation:The Institute of Computational Linguistic Peking University
Abstract:Context environment can be used to describe the meaning similarity between words.Corpus based similarity word extraction can be used in various kind of fields such as lexicon compiling and intelligent search engine.Based on 6 4 million chars of Chinese ancient poetry,a statistic model was defined to extract contextual similarity words from the corpus.A concept based intelligent search engine for Chinese ancient poetry was developed on top of the word similarity relations.The result is encouraging.
Keywords:similarity of word meaning  relevance of word meaing  concept based retrieving  Chinese ancient poetry
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号