共查询到17条相似文献,搜索用时 93 毫秒
1.
基于最小风险的贝叶斯邮件过滤算法 总被引:9,自引:0,他引:9
1.引言随着因特网的迅猛增长,电子邮件作为最快捷、最经济的通信方式,也得到飞速发展。但是,许多销售广告、快速致富等垃圾邮件也在网络中传送,这些垃圾邮件不仅占据邮件服务器的大量存储空间,同时也要用户花费大量时间来处理这些垃圾。尽管一些商业化产品允许用户人工建立垃圾邮件的过滤规则,但是系统要求用户有丰富经验和花去许多时间,而且,由于垃圾邮件在不断改变,用户必须经常调整这些规则,这需要花大量时间。因此,研究邮件自动过滤方法具有重要意义。邮件自动过滤方法研究主要有基于规则和基于概率两种,后者已成为一种主要研究趋势。 相似文献
2.
针对互联网上垃圾邮件给用户带来种种困扰的问题,本文提出了一种基于贝叶斯最小风险分类方法的邮件过滤系统。本方法通过设置损失代价函数,在过滤大部分垃圾邮件的同时,保证了将合法邮件保留,避免了将有用邮件误分类为垃圾邮件时,给用户带来的损失。实验结果表明,本文提出的垃圾邮件过滤系统效果较好。 相似文献
3.
分析了贝叶斯分类方法在中文垃圾邮件过滤中的应用。提出了基于贝叶斯最小风险的垃圾邮件过滤技术,通过选择适当的损失函数,尽可能减少合法邮件的误判。实验结果表明,该方法是切实可行的并具有良好的效果。 相似文献
4.
5.
基于最小风险贝叶斯分类器的茶叶茶梗分类 总被引:1,自引:0,他引:1
目前在茶叶实际生产加工过程中,茶叶茶梗分拣自动化技术还处于不成熟阶段,分拣机械的精确度和效率还不能达到预期目的,必须通过再次人工分拣过程,大大增加了时间和人力成本。针对数码相机采集到的茶叶、茶梗数字图像,经过预处理后提取出样本的颜色和形状特征,并利用多元高斯模型进行建模,通过最小风险贝叶斯分类器对其进行分类。实验证明基于最小风险的贝叶斯分类器的分类方法是可行的,并取得了良好的分类效果。 相似文献
6.
7.
最小风险贝叶斯决策的二值化人脸识别算法 总被引:1,自引:0,他引:1
提出了一种最小风险贝叶斯决策的二值化人脸识别算法,该算法通过设定图像灰度级的阈值对图像进行二值化,统计其出现的频率,计算其类条件概率密度,根据图像的相似性估计其损失函数,利用贝叶斯公式求最小风险,最后根据最小风险判断其所属类别。该方法克服了传统贝叶斯方法难求类内和类间协方差矩阵的缺点,简单易用。实验结果表明,该方法具有可行性,比传统的基于代数的人脸识别算法(PCA、LDA和PCA+LDA)的识别率高,并能有效减少相似类的重叠。 相似文献
8.
针对印刷品斑点检测缺乏有效检测方法的难题,依据统计决策和贝叶斯分析的基本原理,结合模式识别和机器礼堂相关理论技术,提出了一种基于最小风险贝叶斯决策的印刷品斑点检测方法;以烟标图像为例,实验验证了所提算法的准确性与有效性;该实验表明:所提算法能够有效地检测出烟标中的黑色斑点,分割出来的斑点图像基本上保持了原有的形状;最后,提出了进一步的改进方法。 相似文献
9.
10.
11.
集成协同训练算法(ensemble co-training)是将集成学习(ensemble learning)和协同训练算法(co-training)相结合的半监督学习方法,旋转森林(rotation forest)是利用特征提取来构造基分类器差异性的集成学习方法,在对现有的集成协同训练算法研究基础上,提出了基于旋转森林的协同训练算法——ROFCO,该方法重在利用未标记数据提高基分类器之间的差异性和特征提取效果,使基分类器的泛化误差保持不变或下降的同时,能保持甚至提高基分类器之间的差异性,提高集成效果。实验结果表明该方法能取得较好效果。 相似文献
12.
为提高决策树的集成分类精度,介绍了一种基于特征变换的旋转森林分类器集成算法,通过对数据属性集的随机分割,并在属性子集上对抽取的子样本数据进行主成分分析,以构造新的样本数据,达到增大基分类器差异性及提高预测准确率的目的。在Weka平台下,分别采用Bagging、AdaBoost及旋转森林算法对剪枝与未剪枝的J48决策树分类算法进行集成的对比试验,以10次10折交叉验证的平均准确率为比较依据。结果表明旋转森林算法的预测精度优于其他两个算法,验证了旋转森林是一种有效的决策树分类器集成算法。 相似文献
13.
针对现有跌倒检测算法由于缺乏真实老人跌倒样本以及使用年轻人仿真跌倒样本规模较小导致的过拟合和适应性不足等问题,提出了基于随机森林的跌倒检测算法.该算法采用滑动窗口机制,对窗口内的加速度数据进行时间域和变换域处理,提取时间域和变换域特征参数后,在所有样本集中进行有放回的Bootstrap随机抽样和属性随机选择,构建多个基于最佳属性分割的支持向量机(SVM)基本分类器.在线跌倒检测阶段,对多个SVM基本分类器的分类结果采用少数服从多数的原则,给出最终判定结果.实验表明,随机森林跌倒检测算法可获得95.2%的准确率、90.6%的敏感度和93.5%的特异性,明显优于基于SVM和反向传播(BP)神经网络跌倒检测算法,反映出随机森林跌倒检测算法能更准确地检测跌倒行为,具有较强的泛化能力和鲁棒性. 相似文献
14.
高维复杂数据处理是数据挖掘领域中的关键问题,针对现有特征选择分类算法存在的预测精确度失衡、整体分类效率低下等问题,提出了一种结合概率相关性和极限随机森林的特征选择分类算法(P-ERF)。该算法使用充分考虑特征之间相关性与P值结合的特征选择方式,避免了树节点分裂过程中造成的冗余性问题;并以随机树为基分类器、极限随机森林为整体框架,使P-ERF算法获得了更高的精准度和更好的泛化误差。实验结果表明,P-ERF算法相较于随机森林算法、极限随机森林算法,在数据集分类精度与整体性方面均得到良好的效果。 相似文献
15.
针对CTPN算法不能检测倾斜文本和小尺度文本检测效果差的问题,提出一种基于旋转变量的改进文本检测算法(CTPN-R)。通过增加旋转角度预测层,将文本行拆分成一系列带旋转角度的anchor用于网络训练解决文本倾斜问题,加入特征融合层构建特征图金字塔以检测多尺度文本,改进边缘细化层的输出变量和回归方法,优化文本连接。CTPN-R在倾斜文本数据集MSRA-TD500上的检测综合性能指标F-measure达到了77.5%,比CTPN提高了38%。仿真结果表明,CTPN-R对实际场景中的文本图像检测精度高、实时性好,可以检测任意大小、任意方向文本。 相似文献
16.
目前基于博弈论的风险评估方法大多数采用完全信息博弈模型,无法应对攻击者和防御者互不清楚对方行为的情况。基于静态贝叶斯博弈理论建立攻防博弈模型,将攻击者和防御者分为多种类型,全面地分析了博弈的贝叶斯均衡及其存在性,并结合防御者反击行为、攻击成功率对已有的策略收益量化方法进行改进。基于博弈均衡进行攻击行为可信预测,给出了风险评估算法对信息系统所存在的风险进行计算,得到系统风险值。最后,通过一个实例分析验证了模型和算法的有效性。 相似文献
17.
Android操作系统是市场占有率最高的移动操作系统,基于Android平台的恶意软件也呈现爆发式的增长,而目前仍然没有有效的手段进行Android恶意行为的检测,通过分析Android恶意行为的特点,采用基于贝叶斯网络的机器学习算法进行Android恶意行为的检测,通过静态分析的方法进行Android文件静态特征的提取,将Android恶意应用的静态分析与贝叶斯网络相结合,最后通过使用提出的方法构建贝叶斯网络模型,通过实验验证了提出的Android恶意行为检测模型的有效性。 相似文献