提高PageRank算法效率的方法初探 |
| |
引用本文: | 刘悦 程学旗 李国杰. 提高PageRank算法效率的方法初探[J]. 计算机科学, 2002, 29(6): 55-56 |
| |
作者姓名: | 刘悦 程学旗 李国杰 |
| |
作者单位: | 中国科学院计算技术研究所,北京,100080 |
| |
基金项目: | 国家973课题资助(课题编号G1998030413) |
| |
摘 要: | 1.引言 Web是人类历史上承载数据最丰富的信息库,但在Web上查找所需要的信息却很困难,由于Web的海量规模、异构、动态等特性,使得Web文本检索表现出更大的挑战性,广泛地引起了各方面的研究兴趣。该领域当前的流派大体可以分为:经典IR流派,METADATA流派,数据库流派和链接分析流派。本文所讨论的PageRank算法是链接分析流派中的一个典型代表,在页面质量的计算过程中采用链接分析技术,也是第二代搜索引擎的重要特点,各种算法有一个共同的基本思想:它们认为更多地被其他页面链接的页面是质量更好的页面,并且从更重要的页面出发的链接有更大的权重,这个循环定义,通过迭代算法巧妙地打破了循环,除了本文讨论的PageRank算法,另外一个比较著名的算法就是IBM的HITS算法。
|
关 键 词: | PageRank算法 效率 搜索引警 计算机网络 页面质量评价算法 |
On An Improving Strategy for the PageRank Algorithm |
| |
Abstract: | |
| |
Keywords: | |
本文献已被 CNKI 维普 万方数据 等数据库收录! |
|
点击此处可从《计算机科学》下载全文 |
|