首页 | 官方网站   微博 | 高级检索  
     

开放内容空间的Spam页面侦测
引用本文:余旸,Lin Zhangxi,夏国平.开放内容空间的Spam页面侦测[J].武汉科技大学学报(自然科学版),2009,32(2).
作者姓名:余旸  Lin Zhangxi  夏国平
作者单位:1. 北京航空航天大学经济管理学院,北京,100083;Center for Advanced Analytics and Business Intelligence,Texas Tech University,Lubbock,TX USA,79410
2. Center for Advanced Analytics and Business Intelligence,Texas Tech University,Lubbock,TX USA,79410
3. 北京航空航天大学经济管理学院,北京,100083
摘    要:基于链接分析自动侦测Spam页面,提出了一个分阶段机制.采用决策树和链接分析模型对Wikipedia中的所有节点进行Indegree和Outdegree检测,从而产生出一个候选列表,并引入一个启发算法来降低第一类型的错误.设计一个分类器用于分类候选列表,采用TrustRank和SpamRank算法分别从信任种子集和Spam种子集中推算系统页面各自可信概率和Spam概率,从而减少第二类型的错误.然后将产生的候选集合推送至页面编辑,根据编辑判断的结果反馈训练模型,调整权重.结果表明,分阶段侦测模型可自动地侦测Spam页面,其查准率和查全率分别达到78.3%和94%.

关 键 词:开放内容  知识发现

Combating web spam in open content
Yu Yang,Lin Zhangxi,Xia Guopin.Combating web spam in open content[J].Journal of Wuhan University of Science and Technology(Natural Science Edition),2009,32(2).
Authors:Yu Yang  Lin Zhangxi  Xia Guopin
Abstract:
Keywords:Anti-Spam
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号