首页 | 官方网站   微博 | 高级检索  
     

基于PageRank值的文本相似度改进模型
引用本文:熊才权,田浩.基于PageRank值的文本相似度改进模型[J].网络安全技术与应用,2010(6):55-57.
作者姓名:熊才权  田浩
作者单位:湖北工业大学计算机学院,湖北,430068
基金项目:湖北省自然科学基金项目(编号:2007ABA025)资助
摘    要:相似度计算的质量对于搜索引擎的速度和准确率有着很大的影响。本文提出了基于PageRank值的文本相似度改进模型(BPVSM),以PageRank值对文本分类,在计算文本相似度时考虑不同类别的信息差异。对1370条信息进行检索,用改进后的模型对检索结果进行重排序。实验表明,改进后的模型可以提高检索的准确率。

关 键 词:搜索引擎  PageRank  向量空间模型  TF/IDF

A improved text similarity model based on PageRank value
Xiong Caiquan,Tian Hao.A improved text similarity model based on PageRank value[J].Net Security Technologies and Application,2010(6):55-57.
Authors:Xiong Caiquan  Tian Hao
Affiliation:Xiong Caiquan,Tian Hao Hubei University of Technology,Hubei,430068,China
Abstract:The quality of text similarity has a great impact on the speed and accuracy of search engine.This paper proposes an improved similarity model of text vector space,in which the text classification is based on PageRank value,taking into account of the differences among different classification of information when calculate the similarity of vectors.This model is used to retrieve and rank the 1370 informations,the results show that the improved model can improve the accuracy of retrieval.
Keywords:Search engine  PageRank  Vector Space Model(VSM)  TF/ID  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号