基于超链接多样性分析的新型网页排名算法 |
| |
引用本文: | 杨博,陈贺昌,朱冠宇,赵学华.基于超链接多样性分析的新型网页排名算法[J].计算机学报,2014(4):833-847. |
| |
作者姓名: | 杨博 陈贺昌 朱冠宇 赵学华 |
| |
作者单位: | 吉林大学计算机科学与技术学院;符号计算与知识工程教育部重点实验室(吉林大学);吉林大学软件学院 |
| |
基金项目: | 新世纪优秀人才支持计划(NCET-11-0204);国家自然科学基金(61133011,61373053,61300146,61170092,61202308)资助~~ |
| |
摘 要: | 作为搜索引擎的核心部件,网页排名算法决定了搜索到的相关结果以何种顺序呈现给用户,其性能的优劣将会直接影响搜索引擎的服务质量和用户的搜索体验.在计算网页的权威性时,现有的基于链接的网页排名算法和网页作弊检测算法仅关注网页的超链接数量和质量,而忽略了超链接来源的多样性———另一种客观评价网页权威性的重要信息.相比于真正的权威页面(具有大量且来源广泛的入链),通过作弊手段提升排名的网页往往不具有入链来源多样性的特征.基于以上思想,文中分别提出了超链接来源多样性判断方法、超链接权值调整方法,进而提出了基于超链接来源多样性分析的网页排名算法Drank.在多个基准数据集上的实验结果表明:与现有最好的同类算法相比,综合寻找优质页面和抑制网页排名作弊两方面,Drank算法表现出更好的性能.
|
关 键 词: | 搜索引擎 排名算法 作弊检测 链接分析 概率计数 社会计算 社交网络 |
本文献已被 CNKI 等数据库收录! |
|