首页 | 官方网站   微博 | 高级检索  
     

基于向量空间模型的专题文献过滤算法研究
引用本文:焦玉英,刘伟成,孙吉红. 基于向量空间模型的专题文献过滤算法研究[J]. 情报学报, 2005, 24(5): 562-566
作者姓名:焦玉英  刘伟成  孙吉红
作者单位:武汉大学信息管理学院,武汉,430072;武汉大学信息管理学院,武汉,430072;武汉大学信息管理学院,武汉,430072
基金项目:国家自然科学基金(项目批准号:70473067)资助项目研究成果之一。
摘    要:本文从理论上探讨了向量空间模型及其改进模型在专题文献过滤中的相关算法。概念扩充模型解决了词的同义现象,提高了召回率;潜在语义分析模型通过统计方法,提取并量化这些潜在的语义结构,进而消除同义词、多义词的影响,提高文本表示的准确性,从而使专题研究中文献过滤的召回率和准确率都有显著提高。

关 键 词:向量空间模型  信息过滤  算法  潜语义分析
修稿时间:2004-12-07

Arithmetic Research of Literature Filtering Based on Vector Space Model
Jiao Yuying,Liu Weicheng,Sun Jihong. Arithmetic Research of Literature Filtering Based on Vector Space Model[J]. Journal of the China Society for Scientific andTechnical Information, 2005, 24(5): 562-566
Authors:Jiao Yuying  Liu Weicheng  Sun Jihong
Abstract:This article discussed the algorithms of literature filtering based on vector space model (VSM) and other improved models. Concept-expanded VSM can enhance recall through enriching profile with semantically-related terms. LSA (latent semantic analysis) is a kind of VSM, it can improve the recall and precision of literature filtering systems through extracting and representing the contextual-usage meaning of words by statistical computations applied to a large corpus of text and eliminating the influences of synonymy and polysemy.
Keywords:vector space model   information filtering   arithmetic research   latent semantic analysis.
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号