首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 109 毫秒
1.
为减少垃圾邮件在服务器端的出现,以贝叶斯理论为基础,探讨了可在邮件服务器端实现过滤和自我升级的系统;以合法和非法两类邮件的分析为基础,采用贝叶斯模型生成过滤器,用真实邮件进行仿真操作,验证了模型的可行性。  相似文献   

2.
基于CS-SVM与Bagging的垃圾邮件过滤算法研究   总被引:1,自引:0,他引:1  
针对邮件过滤中正常邮件与垃圾邮件误分类代价的不对称性,提出了基于代价敏感支持向量机(CS-SVM)与Bagging的垃圾邮件过滤算法.通过对每个样本赋予不同的代价,利用最小化误分类代价来获得最优分类器,提高了垃圾邮件过滤的正确率.实验结果表明,该算法具有正确率高、能有效降低将正常邮件误判为垃圾邮件的比率等优点.  相似文献   

3.
针对垃圾邮件过滤过程中分类模型难以个性化、难以适应用户兴趣动态变化的问题,提出了一种基于用户行为的个性化邮件分类算法.算法通过分析朴素贝叶斯分类算法的原理,改造朴素贝叶斯的算法使其具有动态调整能力.实验结果表明此算法具有较高的分类精度.  相似文献   

4.
电子邮件的普及给人们的生活带来极大的方便,但目前垃圾邮件的泛滥严重影响了用户的正常使用。贝叶斯算法因简单在英文邮件过滤中取得了良好的过滤效果,分析了贝叶斯算法的原理及其在垃圾邮件过滤中的应用,给出垃圾邮件过滤的整个过滤流程,设计并实现了一种语言无关的垃圾邮件过滤系统。  相似文献   

5.
基于贝叶斯算法的垃圾邮件过滤技术   总被引:8,自引:0,他引:8  
对基于朴素贝叶斯算法的垃圾邮件过滤技术进行了研究分析和实验验证.介绍了向量空间模型(VSM)方法以及特征向量抽取方法,推导和研究了引入“特征之间互相独立”假设的朴素贝叶斯分类算法.采用K次交叉验证的方法,以收集的一些邮件为语料,应用朴素贝叶斯分类算法,通过训练集计算得到类别的先验概率和特征项的类条件概率,并以此为基础对测试集中的邮件进行归属判断,以正确率和召回率为指标给出了实验结果.  相似文献   

6.
基于朴素贝叶斯算法的垃圾邮件过滤器是目前比较高效、经济的垃圾邮件过滤技术之一,它已经广泛应用到垃圾邮件过滤领域。文章在对朴素贝叶斯过滤器分析的基础上,针对朴素贝叶斯算法的缺陷结合损失最小化的思想,并根据垃圾邮件的特性对朴素贝叶斯算法做了改进,提出了改进朴素贝叶斯算法,该算法能够通过调整k值,降低合法邮件被错判为垃圾邮件的概率,从而最大程度减少用户的损失。  相似文献   

7.
基于贝叶斯分类的邮件过滤方法及模型研究   总被引:5,自引:1,他引:5  
垃圾邮件日益泛滥,给用户带来了极大的不便和危害.并对网络安全构成威胁.传统邮件过滤方法单一,过滤精度不高,已不能很好地满足需求.结合规则过滤技术,分析了基于文本内容的贝叶斯分类器实现的关键技术与方法,并给出核心过滤算法在邮件分类中的实现具体方法及过程,进而完成垃圾邮件的判别.为减少邮件的误判对用户造成的损害及垃圾邮件漏判造成的影响,提出相应的改进措施,使用最小风险贝叶斯决策减小误判率,对分类系统经训练部分进行自适应调整,最后给出基于规则与内容的双重防范机制的邮件过滤模型及基于该框架的邮件判别流程.  相似文献   

8.
为实现对电子邮件中垃圾邮件的过滤,提出一种新的邮件过滤算法和邮件过滤Agent的设计方法。Agent通过算法学习用户接收邮件的信息及用户对邮件的处理习惯,据此最终确定邮件是否为垃圾邮件或病毒邮件,从而过滤掉非正常邮件。实验测试表明,Agent对邮件过滤的正确率可达85%,为现有电子邮件系统提供了一种改进方法。  相似文献   

9.
一种混合的垃圾邮件过滤算法研究   总被引:3,自引:0,他引:3  
贝叶斯邮件过滤器具有较强的分类能力,极高的准确率,在内容过滤领域占据主导地位。人工免疫系统具备强大的自学习、自适应,鲁棒性等能力,已发展成为计算智能研究的一个崭新的分支。该文在分析贝叶斯的原理和人工免疫的仿生机理的基础上,将贝叶斯与人工免疫相结合,设计和实现了一种基于贝叶斯和人工免疫的混合垃圾邮件过滤算法,并利用现有的垃圾邮件语料库得到预期的实验结果。  相似文献   

10.
随着对垃圾邮件问题的普遍关注,针对目前邮件过滤方法中存在着的语义缺失现象和处理群发型垃圾邮件低效问题,提出一种基于潜在语义分析(LSA)和信息-摘要算法5(MD5)的垃圾邮件过滤模型。利用潜在语义分析标注垃圾邮件中潜在特征词,从而在过滤技术中引入语义分析;利用MD5在LSA分析基础上,对群发型垃圾邮件生成"邮件指纹",解决过滤技术在处理群发型垃圾邮件中低效的问题。结合该模型设计了一个垃圾邮件过滤系统。采用自选数据集对文中设计的系统进行测试评估,经与Naïve Bayes算法过滤器进行比较,证明该方法在垃圾邮件过滤上优于Naïve Bayes方法,实验结果达到了预期的效果,验证了该方法的可行性、优越性。  相似文献   

11.
针对无迹卡尔曼滤波(UKF)算法在单站无源定位中滤波的性能容易受到初始值和系统噪声影响的问题,提出了一种自适应无迹卡尔曼滤波(AUKF)的跟踪算法。该算法利用观测信息和新息,引入自适应因子,对在滤波过程中的误差的协方差矩阵进行合理自适应调整,保证得到较稳定和高精度的滤波值,从而提高算法的鲁棒性。仿真结果表明,该AUKF算法与扩展卡尔曼滤波算法(EKF)及其衍生算法中的修正协方差滤波算法(MVEKF)和UKF算法相比,对系统噪声的鲁棒性更好,体现在滤波的收敛速度和滤波精度等方面都有所提高,是一种性能更加优越的算法。  相似文献   

12.
设计并实现中文垃圾短信过滤器,能够较好识别不断变化的垃圾短信。以逻辑回归模型为基础,提出字节级n元文法提取短信特征,并采用TONE(Train On or Near Error)方法训练过滤器。通过实验测试,证明应用该方法实现的垃圾短信过滤效果很好。  相似文献   

13.
基于机器学习的垃圾邮件过滤技术是当前垃圾邮件过滤的主流方法。机器学习模型主要分为两类:以朴素贝叶斯(NB)为代表的生成模型和以逻辑回归模型(LR)、支持向量机模型(SVM)为代表的判别学习模型。以往对两种模型的研究都是针对某一种语言进行,对于模型的语言独立性与相关性研究较少。因此,在中文数据集和英文数据集上比较典型的生产模型和判别学习模型的过滤性能。比较Bogo(Bogo系统是基于贝叶斯算法的,它是典型的生成模型)、逻辑回归模型和松弛在线支持向量机(两种典型的判别学习模型)在中英文数据集上的过滤性能。其中:实验是在公开英文数据集TREC05p-1、TREC06p和公开中文数据集TREC06c、SEWM2011上进行。实验结果显示基于判别模型垃圾邮件过滤器性能明显优于基于生成模型,并且相同的模型在中文数据集上显示了较好的效果。  相似文献   

14.
目前的NTP(Network Time Protoc01)时钟同步算法已不能满足许多新兴网络对时钟同步精度的要求。为此,提出一种基于DS(Dempster/Shafer)理论的NTP时钟同步改进算法。在分析目前NTP时钟同步算法不足的基础上,将Ds理论引进到传统的NTP时钟同步中,建立一种改进的NTP时钟同步算法并进行了仿真实验。实验结果表明,与传统算法相比,该NTP时钟同步算法有效地提高了同步精度。  相似文献   

15.
为了提高数据库的数据质量,需要对相似重复记录进行清洗,基本邻近排序算法是目前常用的清洗算法之一. 针对判重过程中属性权值计算主观性过强的问题,提出通过多用户综合评判确定属性权值的方法,该方法能更客观地评判属性的重要性程度. 在此基础上,结合属性权值计算两条记录的长度比例,排除不可能构成相似重复的记录,减少了比较次数,提高了检测效率. 实验结果表明改进算法在查全率、查准率及时间效率等方面均有所提高  相似文献   

16.
针对传统的CF(Collaborative Filtering)算法和基于项目评分的CF算法中存在的数据稀疏、扩展性及计算效率低的问题,通过引用评价系数,对其相似性计算和推荐集的选取方法进行了改进,提出了一种改进的基于相关相似性的CF算法,产生更为准确的用户兴趣度预测,从而提高系统推荐的质量与推荐效率。对改进算法进行实验和性能对比与评价的结果表明,改进算法与传统算法相比,能显著提高推荐精度,平均绝对误差(MAE:Mean Absolute Error)为0.53~0.77。  相似文献   

17.
状态误差协方差矩阵和状态估计的精度直接影响卡尔曼滤波(KF)性能.为减小滤波误差,提高卡尔曼滤波精度,基于单极点反馈积累理论,提出了一种改进的卡尔曼滤波算法.该算法利用单极点反馈积累思想,通过综合当前时刻和过去时刻信息实现对估计参数的良好逼近,更新卡尔曼滤波中的状态误差协方差矩阵和状态估计来提高其估计精度.理论分析和仿真结果表明:该算法与KF算法相比,对跟踪效果有一定改善,使位置、速度跟踪误差有效降低并保持其误差曲线平滑,提高了滤波/跟踪精度.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号