首页 | 官方网站   微博 | 高级检索  
     

一种基于时间流特性的垃圾邮件过滤方法
引用本文:徐隽,郑佳谦,姚静,牛军钰.一种基于时间流特性的垃圾邮件过滤方法[J].中文信息学报,2009,23(1):79.
作者姓名:徐隽  郑佳谦  姚静  牛军钰
作者单位:复旦大学 计算机科学与工程系, 上海200433
摘    要:垃圾邮件过滤具有处理规模巨大,数据无限递增、动态变化等流数据特征,传统的垃圾邮件过滤方法利用静态的文本特征提取方法,无法体现流数据特征随时间动态变化的特点。该文提出一种基于时间流特性来实时调整有效特征的垃圾邮件过滤方法,在TREC Spam Track语料集上的测试结果表明,该方法在保证垃圾邮件过滤高准确率的同时,使垃圾邮件过滤计算的时间性能和空间性能更加优化。


关 键 词:计算机应用  中文信息处理  垃圾邮件  流数据  时间流  文本分类  特征选择
  

A Time-Stream Based Method on Spam Filtering
XU Jun,ZHENG Jia-qian,YAO Jing,NIU Jun-yu.A Time-Stream Based Method on Spam Filtering[J].Journal of Chinese Information Processing,2009,23(1):79.
Authors:XU Jun  ZHENG Jia-qian  YAO Jing  NIU Jun-yu
Affiliation:Department of Computer Science and Engineering, Fudan University, Shanghai 200433, China
Abstract:Spam filtering has some characteristics in common with stream data processing,such as high-volume scale,infinite increase and dynamical change.Traditional spam filtering methods use static feature selection approaches which cannot reflect that features of stream data are always dynamically changing as time goes by.In this paper,we propose a spam filtering method based on the characteristics of time stream which can adjust the effective features used for filtering in real time.The experimental results based ...
Keywords:computer application  Chinese information processing  spam  stream data  time stream  text classification  feature selection  
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号