首页 | 官方网站   微博 | 高级检索  
     

一种抵抗链接作弊的PageRank改进算法
引用本文:贺志明,王丽宏,张刚,程学旗.一种抵抗链接作弊的PageRank改进算法[J].中文信息学报,2012,26(5):101-107.
作者姓名:贺志明  王丽宏  张刚  程学旗
作者单位:1. 中国科学院计算技术研究所,北京 100190; 2. 国家计算机网络与信息安全管理中心,北京 100029
基金项目:国家自然科学基金资助项目,国家863计划重点资助项目
摘    要:大量的基于链接的搜索引擎作弊方法对传统PageRank算法造成了巨大的影响,例如,链接农场、交换链接、黄金链、财富链等使得网页的PageRank值失去了公正性和权威性。该文在分析多种作弊方法对传统PageRank算法所造成的不利影响的基础上,提出了一种可以抵抗链接作弊的三阶段PageRank算法-TSPageRank算法,该文对TSPageRank算法的原理进行了详细分析,并通过实验证明TSPageRank算法比传统的PageRank算法在效果上提高了59.4%,能够有效地提升重要网页的PageRank值,并降低作弊网页的PageRank值。

关 键 词:搜索引擎作弊  PageRank算法  链接农场  

An Improved Pagerank Algorithm with Anti-Link Spam
HE Zhiming,WANG Lihong,ZHANG Gang,CHENG Xueqi.An Improved Pagerank Algorithm with Anti-Link Spam[J].Journal of Chinese Information Processing,2012,26(5):101-107.
Authors:HE Zhiming  WANG Lihong  ZHANG Gang  CHENG Xueqi
Affiliation:1. Institute of Computing Technology, Chinese Academy of Sciences, Beijing 100190, China;
2. National Computer Network and Information Security Management Center, Beijing 100029,China
Abstract:A large number of link-based spams caused a huge impact on traditional PageRank algorithm, such as link farm, link exchange, golden links and so on. This paper proposes a new PageRank algorithm named Three Stages PageRank algorithm(TSPageRank) which can resist link spam to a certain extent. Through experiments, we found out that TSPageRank algorithm increased 59.4% on the result of PageRank. TSPageRank can increase the PR of useful and authority pages and decrease the PR of spam and rubbish pages.
Key wordssearch engine spam; PageRank algorithm; link farm
Keywords:search engine spam  PageRank algorithm  link farm  
本文献已被 万方数据 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号