首页 | 官方网站   微博 | 高级检索  
     

一种基于概率推理的邮件过滤系统的研究与设计
作者单位:安徽大学计算智能与信号处理教育部重点实验室 安徽合肥230039
摘    要:分类问题是机器学习与数据挖掘研究中最重要的问题之一,其中文本自动分类是信息检索与数据挖掘领域的研究热点与核心技术,近年来得到了广泛的关注和快速的发展。设计了一种基于贝叶斯概率推理方法的垃圾邮件过滤系统。它用概率测试的权重来描述数据间的相关性,从而解决了数据间的不一致性,甚至是相互独立的问题。作为互联网的第一大应用,电子邮件一直受到广大网民的青睐,但近些年来,垃圾邮件问题日益严重。将上述研究的结果应用到目前互联网上垃圾邮件的过滤工作中,实验证明了方法的有效性。

关 键 词:机器学习  文本分类  垃圾邮件  贝叶斯方法

Research and Design of a Spam Filtering System Based on Probability Inference
Authors:TANG Wei  CHENG Jia-xing  JI Xia
Abstract:Classification is one of the most important research fields in data mining and machine learning.In recent years,there have been extensive studies and rapid progresses in automatic text categorization,which is one of the hotspots and key techniques in information retrieval and data mining field.Designs a spam email filtering system based on improved Bayesian probability inference.It uses weight from probability test to describe the correlativity of data;consequently it solves the inconsistent and mutual independent problems.Applies it to the spam filtering work on Internet,the validity of this system is proved.At last,some future directions of the research are given.
Keywords:machine learning  text classification  spam  Bayesian method
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号