基于Hadoop平台的电子邮件分类 |
| |
引用本文: | 邵叶秦.基于Hadoop平台的电子邮件分类[J].数字社区&智能家居,2014(34):8119-8121. |
| |
作者姓名: | 邵叶秦 |
| |
作者单位: | 南通大学现代教育技术中心 |
| |
基金项目: | 国家自然科学基金(61171132);南通市应用研究计划项目(BK2012034) |
| |
摘 要: | 为了从大量的电子邮件中检测垃圾邮件,提出了一个基于Hadoop平台的电子邮件分类方法。不同于传统的基于内容的垃圾邮件检测,通过在Map Reduce框架上统计分析邮件收发记录,提取邮件账号的行为特征。然后使用Map Reduce框架并行的实现随机森林分类器,并基于带有行为特征的样本训练分类器和分类邮件。实验结果表明,基于Hadoop平台的电子邮件分类方法大大提高了大规模电子邮件的分类效率。
|
关 键 词: | Hadoop MapReduce 大规模 垃圾邮件 分类 |
本文献已被 CNKI 等数据库收录! |
|