首页 | 官方网站   微博 | 高级检索  
     

一种基于链接结构的Spam网页过滤算法
引用本文:陈小飞,王轶彤.一种基于链接结构的Spam网页过滤算法[J].计算机研究与发展,2010,47(Z1).
作者姓名:陈小飞  王轶彤
作者单位:复旦大学计算机科学技术学院,上海,201203
摘    要:随着网络的高速发展,如何在海量信息中找到用户需求的高质量信息变得非常重要,技术难度较大.网页在搜索结果中排名是否靠前与巨大的商业利润相关联,这使得大量的垃圾网页出现在网络中.过滤Spam页面、给用户提供高质量的搜索结果成为当前Web搜索引擎的面临的一个巨大挑战.大量研究工作显示Spam页面之间存在着勾结的现象,分析Spam页面链接结构特性成为过滤Spam页面的重要方法.根据Spam网页链接结构存在的共性,提出了一种基于链接分析的Web Spam过滤方法.在标准检测数据集上进行实验,并与相关工作进行比较.实验结果表明,提出的方法能有效地对Spam网页进行过滤,提高搜索结果的质量.

关 键 词:Web挖掘  PageRank算法  Spam网页  聚类  链接分析

A Link-Based Web Spam Flitting Method
Chen Xiaofei,Wang Yitong.A Link-Based Web Spam Flitting Method[J].Journal of Computer Research and Development,2010,47(Z1).
Authors:Chen Xiaofei  Wang Yitong
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号