首页 | 官方网站   微博 | 高级检索  
     

基于Hadoop平台的电子邮件分类
引用本文:邵叶秦.基于Hadoop平台的电子邮件分类[J].数字社区&智能家居,2014(34):8119-8121.
作者姓名:邵叶秦
作者单位:南通大学现代教育技术中心
基金项目:国家自然科学基金(61171132);南通市应用研究计划项目(BK2012034)
摘    要:为了从大量的电子邮件中检测垃圾邮件,提出了一个基于Hadoop平台的电子邮件分类方法。不同于传统的基于内容的垃圾邮件检测,通过在Map Reduce框架上统计分析邮件收发记录,提取邮件账号的行为特征。然后使用Map Reduce框架并行的实现随机森林分类器,并基于带有行为特征的样本训练分类器和分类邮件。实验结果表明,基于Hadoop平台的电子邮件分类方法大大提高了大规模电子邮件的分类效率。

关 键 词:Hadoop  MapReduce  大规模  垃圾邮件  分类
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号