首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
微信的快速普及加快了信息的传播,随之而来的广告、诈骗等信息严重困扰人们的生活。针对朴素贝叶斯对信息分类时考虑所有特征并将特征赋予相同权值两方面的缺陷,提出一种用于微信信息分类的改进贝叶斯算法。采用改进的互信息进行特征选择,提取关键特征,通过改进TFIDF对特征加权,优化朴素贝叶斯的分类性能。实验结果表明,改进的贝叶斯算法能有效选择关键特征属性,提高微信信息分类的精准度。  相似文献   

2.
为了解决传统串行朴素贝叶斯算法分类性能低下的问题,提出一种基于朴素贝叶斯算法的并行化分类方法。选取多项式朴素贝叶斯,搭建Hadoop集群,通过卡方检验选取特征词,利用词频-逆文本频率指数方法计算出每个特征项的权值,并求出每类的权重总和,将权值应用到朴素贝叶斯公式中得到分类结果。实验结果表明:在该集群上设计的并行化朴素贝叶斯分类方法较比传统朴素贝叶斯方法,其精确率,召回率,F1值分别至少提高了7.66%,7.56%,11.98%,且用时更短,说明本文的方法能够提高处理文本的时间效率。  相似文献   

3.
软件可靠性综合模型   总被引:9,自引:0,他引:9  
提出了多模型加权平均的软件可靠性综合模型,通过权值的动态调整实现模型的选择与混合.选择的目的是要找出最适合待评估软件的模型,混合目的是要综合各模型的评估结果.所以,关键是要进行权值的动态调整.为此提出用贝叶斯分析理论进行权值计算的方法,将权值作为贝叶斯超参数,根据实际数据进行超参数更新,从而达到权值计算的目的.  相似文献   

4.
目前恶意软件的安全威胁越来越严重,提高恶意软件的识别准确率已成为亟待解决的问题。针对朴素贝叶斯方法恶意软件识别准确率不高的问题,提出一种利用萤火虫算法改进加权贝叶斯的恶意软件识别方法,以恶意软件的行为数据作为特征,通过萤火虫算法不断地迭代来优化样本属性的权值,将权值带入加权贝叶斯模型中识别恶意软件,通过对virusshare网站的1300个样本进行实际检测,相比于朴素贝叶斯和互信息加权贝叶斯恶意软件识别方法,其平均识别准确率分别提高了17%和6%,表明新方法具有更好的识别效果。  相似文献   

5.
模式分类旨在依据识别对象特征的观察值将其归并至某个类别,贝叶斯分类决策可实现模式分类.给出一类遵从特征观察量独立性假设的贝叶斯分类器即朴素贝叶斯分类器设计.并给出朴素贝叶斯分类器的分类误差估计方法.理论分析与实验结果表明,朴素贝叶斯分类器设计方案可行,且其分类误差估计方法有效,可用于模式分类事务处理.  相似文献   

6.
提出网页恶意脚本代码的监测系统,将恶意脚本用V8引擎编译成机器码,用变长N-Gram模型对其进行数据处理,提取特征形成样本训练集.分别与随机森林、逻辑回归及朴素贝叶斯等分类器组合创建分类模型.研究将多个经过训练集训练的分类模型集成,提出加权分类器集成的方式,每个分类器设定不同权值.通过实验分析,试验多种分类器组合,并通过训练集找出最优权值分配.通过比较单个分类器和其他集成方式,结果证明训练过的加权集成分类器的方式能更准确地检测网页存在恶意行为的代码,有较高的准确率.  相似文献   

7.
基于贝叶斯算法的垃圾邮件过滤技术   总被引:8,自引:0,他引:8  
对基于朴素贝叶斯算法的垃圾邮件过滤技术进行了研究分析和实验验证.介绍了向量空间模型(VSM)方法以及特征向量抽取方法,推导和研究了引入“特征之间互相独立”假设的朴素贝叶斯分类算法.采用K次交叉验证的方法,以收集的一些邮件为语料,应用朴素贝叶斯分类算法,通过训练集计算得到类别的先验概率和特征项的类条件概率,并以此为基础对测试集中的邮件进行归属判断,以正确率和召回率为指标给出了实验结果.  相似文献   

8.
朴素贝叶斯分类器是一种简单高效的分类算法,但其属性独立性假设影响了分类效果。通过放松朴素贝叶斯假设可以增强朴素贝叶斯的分类效果,但是通常会导致计算代价大幅提高。针对以上问题,提出了一种基于粗糙集的特征加权朴素贝叶斯算法,加权参数直接从训练数据中学习得到,可以看作是计算某个后验概率时,某个特征对于该类别的影响程度。将该分类算法与朴素贝叶斯分类器(na ve bayesian classifier,NB)、贝叶斯网(bayes networks)和NBTree分类器进行实验比较。结果表明:在大多数数据集上,FWNB分类器在较小的计算代价下,具有较高的分类正确率。  相似文献   

9.
针对文本训练集中各个类别的样本分布不均衡时,少数类别的特征会被多数类别的特征淹没的问题,提出一种属性加权补集的朴素贝叶斯文本分类算法,该算法使用属性加权改进补集朴素贝叶斯算法,使用TF-IDF算法计算特征词在当前文档中的权重;利用当前类别补集的特征表示当前类别的特征并结合特征词在文档中的权重,解决分类器容易倾向大类别而忽略小类别的问题。与传统的朴素贝叶斯及补集朴素贝叶斯算法进行对比实验,结果表明:在样本集分布不均衡时,改进算法的性能表现最优,分类准确率、召回率及G-mean性能分别可达82.92%、84.6%、88.76%。  相似文献   

10.
针对朴素贝叶斯分类器硬分类的不足,将模糊C-均值聚类与朴素贝叶斯分类相结合,提出一类新的基于模糊聚类的混合朴素贝叶斯分类模型,并给出它的分类误差估计方法。理论分析与实验结果表明,基于模糊聚类的混合朴素贝叶斯分类模型可行,其分类的误差估计方法有效。新的基于模糊聚类的混合朴素贝叶斯分类模型提高了模式分类能力。  相似文献   

11.
Lucene的最小风险概率加权朴素贝叶斯算法   总被引:1,自引:0,他引:1  
为了提高垃圾邮件过滤的准确性,在分析垃圾邮件数据的基础上,对比信息检索与信息过滤之间的关系,将信息检索框架Lucene应用到垃圾邮件过滤系统中,提出最小风险概率加权的朴素贝叶斯算法,与最小风险法结合,有效地减少贝叶斯方法的独立性约束.实验验证了加权朴素贝叶斯算法的有效性.  相似文献   

12.
为解决路面积雪状态(轻微、严重)检测问题以保证行车安全,利用监控视频得到路面实时状态,采用朴素贝叶斯分类方法进行积雪状态检测。首先利用机器视觉和视频目标分割方法提取视频中路面视觉特征,然后采用朴素贝叶斯分类方法进行路面积雪状态分类,通过实验,综合比较了朴素贝叶斯分类与KNN分类、人工神经网络(ANN)、支撑向量机(SVM)在路面积雪状态检测问题中的有效性,结果表明,朴素贝叶斯分类器更适合积雪状态的分类。  相似文献   

13.
数据库信息分类中,朴素贝叶斯分类模型是一种简单而有效的分类方法,但它的属性独立性假设使其无法表达属性变量间存在的依赖关系,影响了它的分类性能.而一般贝叶斯网络模型则由于能表达属性变量之间的依赖关系而越来越受到人们的重视,但一般贝叶斯网络分类模型结构的学习算法是一个NP完全问题.本研究在一种简化的贝叶斯网络分类模型的基础上,利用其多项式时间复杂度的结构学习算法,将其应用于数据库信息分类,实现了学习效率和分类精度的一种折衷.实验结果表明,这种分类方法有着比较高的数据库信息文本检索性能。  相似文献   

14.
针对滚动轴承质量分类检测和贝叶斯分类器在实际应用中存在的问题,提出了基于PCA和贝叶斯分类技术的滚动轴承质量检测方法.理论分析和实验结果表明:基于PCA和贝叶斯方法的滚动轴承质量分类技术具有模型简单,检测速度快等优点,可以在实际应用中发挥有效作用.  相似文献   

15.
给出了一种使用在线线性判别学习模型进行垃圾邮件过滤的方法,使用贝叶斯理论进行特征提取,特征按出现的位置进行分类,不同类别的特征赋予不同的权重.在TREC测试集上进行了实验,并和TREC评测的结果进行了对比.实验结果表明,该方法取得了较好的结果.  相似文献   

16.
分析了基于加权的集成预测,研究了一种基于贝叶斯的BP神经网络集成挖掘方法,通过R平台实现算法,成功地应用于上市公司财务预警。各种预测方法实验结果对比得出,集成预测可以提高财务风险预测的准确率。  相似文献   

17.
针对类不平衡或类分布偏斜数据分类器性能评估问题,提出了一种不平衡数据分类器的性能评估方法——加权AUC(wAUC),为区分不同类别上的正确率对总体性能的不同贡献,在计算ROC曲线下方面积的加权值时,根据真正率TPrate的取值,对不同区域采用不同的权值,使得评估度量更关注于正类准确度。讨论了权值函数应具有的性质,给出了wAUC的性质分析。理论分析和实验结果表明,加权AUC优于OP和AUC。  相似文献   

18.
当前遥感影像空间分辨率越来越高,对分类方法的要求也越来越高.针对城市地区高空间分辨率遥感影像,选取了两种不同数据源的高分城区遥感数据,先进行多尺度分割、特征提取,然后使用BF+CFS方法进行特征选择,再通过K最近邻、贝叶斯、支持向量机、决策树、随机森林等五种分类方法对遥感影像进行分类,并对比分析不同分类方法的分类结果及精度.研究结果表明,贝叶斯、决策树和随机森林分类对城区高分影像的分类精度较高.其中随机森林分类方法的分类结果最准确,但分类时涉及参数设置较多,对于实际生产应用的适用性不高;而贝叶斯分类操作简单,分类精度较高,更适用于城区高分遥感数据的生产应用.  相似文献   

19.
针对网络环境不稳定导致Web服务质量(QoS)数据中存在噪声数据,进而降低Web服务质量预测精度的问题,提出一种基于贝叶斯分类的混合协同过滤Web服务质量值预测方法.该方法使用贝叶斯算法对Web服务质量数据进行分类并得到每个分类的概率,利用分类结果确定缺失值可能的取值范围,并对用户和服务的相似邻居进行过滤.通过引入分类概率,改进传统的协同过滤方法得到最终的缺失值预测结果,在一定程度上消除了噪声数据对Web服务质量预测的影响.实验结果表明:较之现有方法,该方法具有更好的预测精度.  相似文献   

20.
优化目标决定了贝叶斯网络分类器的分类性能.文章围绕生成函数和判别函数等两类典型的优化目标,对比分析了贝叶斯网络在不同学习目标下的学习方法,应用UCI数据集,通过实验对比了训练样本数量的变化对贝叶斯网络分类器性能的影响,分析了贝叶斯网络分类器的目标函数与分类性能的关系.数据实验结果表明:冗余数据对判别贝叶斯网络过拟合的影响大于生成贝叶斯网络,“最优”贝叶斯网络分类器并不一定具有最大的联合似然值或者条件似然值;为了提高学习效率和分类性能,可在训练判别贝叶斯网络的过程中采用主动样本选择策略,并且以生成函数和判别函数的权衡值作为贝叶斯网络分类器的优化目标.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号