首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
针对垃圾邮件过滤过程中分类模型难以个性化、难以适应用户兴趣动态变化的问题,提出了一种基于用户行为的邮件分类算法。通过分析朴素贝叶(NB)斯分类算法的原理,改造朴素贝叶斯算法,使其具有动态调整能力。邮件服务器接收到新邮件后自动进行分类判别,用户浏览邮件的过程中对邮件进行操作,根据用户对错分邮件的处理自动将该邮件加入训练数据集,并动态更新相应特征的统计概率,使邮件分类算法能够依据用户对不同邮件的操作行为动态调整分类模型,以达到有效过滤垃圾邮件的目的。与常用的贝叶斯分类算法的实验比较表明在给定小样本集合进行训练的情况下,新算法对于垃圾邮件的识别率比传统的朴素贝叶斯方法、基于风险敏感的朴素贝叶斯方法等提高了10%,获得了较好的分类性能。  相似文献   

2.
张晓丹  乔晓东  梁冰 《计算机工程与设计》2011,32(10):3364-3367,3373
针对网页自动分类中存在的类边界模糊、语料不均匀等引起的分类不确定性问题,提出了贝叶斯网络自动分类融合模型和融合算法,该模型和算法基于网页上多种信息进行融合,并采用不同的与处理方法分别对多种信息进行处理,将处理后的信息输入到贝叶斯网络融合中心进行融合推理,得到最终的分类结果。同时,为了降低贝叶斯网络推理时间复杂度,提出了改进的贝叶斯网络图推理算法。实验结果表明,改进后的融合模型和融合算法能有效解决网页自动分类中的不确定性问题,并能提高网页自动分类的准确率和查全率。  相似文献   

3.
基于改进贝叶斯的书目自动分类算法   总被引:1,自引:0,他引:1  
贝叶斯算法被广泛应用于书目自动分类领域。该算法常使用差分进化算法来评估概率项,但是传统的差分进化算法容易陷入局部最优解,使得贝叶斯分类精度较低。针对该问题,提出了基于改进贝叶斯的书目自动分类方法。该方法通过多父突变和交叉操作估计概率项的最优解,提高贝叶斯分类精度;在进行书目自动分类时,先采用ICTCLAS系统进行文本预处理,再提取文本的词频-逆向文件频率特征,接着采用改进的贝叶斯估计方法对特征进行训练与分类,最终实现书目的自动分类。仿真结果表明,该方法具有较高的分类准确率。  相似文献   

4.
贝叶斯算法因其简单、快速、分类精确度高等优点被广泛应用于垃圾邮件过滤中,然而随着时间的推移,概念漂移现象导致贝叶斯分类器准确率下降。针对此问题,提出了基于用户反馈的客户端贝叶斯动态学习算法,可自动学习新的邮件样本,计算复杂度较低。实验表明该方法能较好地适应概念漂移,满足邮件分类的个性化需求,有很好的实用性。  相似文献   

5.
郭鹏  李乃祥  刘同海 《计算机工程》2011,37(10):143-145
提出利用进化MCMC算法进行动态贝叶斯网络(DBN)学习的方法。在数据缺省情况下利用EM算法进行贝叶斯网络参数学习,结构学习部分生成多条备选的贝叶斯网络染色体,对染色体进行变异操作和交叉操作,在遗传操作中根据温度参数和贝叶斯网络及贝叶斯信息准则来构造MCMC函数,并利用MCMC函数进行贝叶斯网络学习。每一代进化后,将贝叶斯信息评分最大的贝叶斯网络作为结构学习的结果。实验结果验证了该方法性能的稳定性。  相似文献   

6.
先验信息不确定条件下贝叶斯网结构学习方法   总被引:2,自引:1,他引:1       下载免费PDF全文
针对先验信息不确定条件下的贝叶斯网络学习问题,提出了一种非确定先验结构信息贝叶斯网络的结构学习方法。主要在以下几个方面开展了工作:提出了一种贝叶斯网络结构的不确定先验信息表示方法;改进了MDL测度,提出了SMDL测度,使之能在学习过程中考虑先验信息的不确定性;基于模拟退火算法,对问题进行求解。最后通过实验对算法的可行性进行了验证。  相似文献   

7.
许明英  尉永清  赵静 《计算机应用》2011,31(9):2530-2533
贝叶斯分类器形成初期,训练集不完备,生成的分类器性能不理想且不能动态跟踪用户需求。针对此缺陷,提出一种结合反馈信息的贝叶斯分类增量学习方法。为有效降低特征间的冗余性,提高反馈特征子集的代表能力,用一种基于遗传算法的改进特征选择方法选取反馈集中最优特征子集修正分类器。通过实验分析了算法的性能,结果证明该算法能明显优化分类效果,且整体稳定性较好。  相似文献   

8.
贝叶斯网络是数据挖掘领域的研究热点,它是一种确定事物间不确定性依赖关系的有效工具。本文研究传统贝叶斯网络结构学习算法的优点和不足,并针对原算法的不足之处提出了改进。将改进后的算法应用于健康大数据集上,确定了数据集中各个健康属性之间的依赖关系,建立了相关属性依赖关系的网络结构。最终运用该网络结构对数据集中的数据进行自动分类。实验结果表明,本文基于贝叶斯网络建立的健康大数据分类模型具有良好的性能,实现了预期效果。  相似文献   

9.
黄伟  林劼  江育娥 《计算机应用》2016,36(5):1212-1215
用户提交的软件错误报告随意性大、主观性强且内容少导致自动分类正确率不高,需要花费大量人工干预时间。随着互联网的快速发展用户提交的错误报告数量也不断增加,如何在海量数据下提高其自动分类的精确度越来越受到关注。通过改进词频-逆文档频率(TF-IDF),考虑到词条在类间和类内出现情况对文本分类的影响,提出一种基于软件错误报告数据集的改进多项式朴素贝叶斯算法,同时在Hadoop平台下使用MapReduce计算模型实现该算法的分布式版本。实验结果表明,改进的多项式朴素贝叶斯算法将F1值提高到71%,比原算法提高了27个百分点,同时在海量数据下可以通过拓展节点的方式缩短运行时间,有较好的执行效率。  相似文献   

10.
随着信息共享时代的发展,海量数据的诞生对推荐系统提出了更高的要求.针对微博的海量数据,提出了一种融合朴素贝叶斯分类和基于用户的协同过滤算法的混合推荐算法.该算法将文本关键字作为特征属性,利用贝叶斯分类法筛选出用户可能感兴趣的数据,缩小推荐结果集;然后采用基于用户的协同过滤算法,通过计算用户相似度,根据最近邻居得到推荐结...  相似文献   

11.
增量学习利用增量数据中的有用信息通过修正分类参数来更新分类模型,而朴素贝叶斯算法具有利用先验信息以及增量信息的特性,因此朴素贝叶斯算法是增量学习算法设计的最佳选择。三支决策是一种符合人类认知模式的决策理论,具有主观的特性。将三支决策思想融入朴素贝叶斯增量学习中,提出一种基于三支决策的朴素贝叶斯增量学习算法。基于朴素贝叶斯算法构造了一个称为分类确信度的概念,结合代价函数,用以确定三支决策理论中的正域、负域和边界域。利用三个域中的有用信息构造基于三支决策的朴素贝叶斯增量学习算法。实验结果显示,在阈值[α]和[β]选择合适的情况下,基于该方法的分类准确性和召回率均有明显的提高。  相似文献   

12.
邓丽  金立左  费敏锐 《计算机工程》2011,37(22):281-283
小样本问题会制约贝叶斯相关反馈算法的学习能力。为此,提出一种基于半监督学习的视频检索贝叶斯相关反馈算法,其中一个分类器用于估计视频库中每一个镜头属于目标镜头的概率,另一个半监督学习分类器用于判断用户未标记镜头是否与目标相关,由此扩大贝叶斯学习器的训练数据集,提高其分类能力。实验结果表明,该算法提高了贝叶斯算法的检索性能。  相似文献   

13.
基于多智能体的个性化信息系统研究   总被引:8,自引:0,他引:8  
王勇  陈新  陈新度 《计算机工程》2005,31(18):31-33
提出了一种基于多智能体机制的个性化信息系统(PNSS),通过建立用户操作的动态特征模型,运用基于语义及统计的文本匹配算法,结合用户基本特征,实现了信息的自动归类和排序,使得用户能够对其最重要的信息迅速作出决策.  相似文献   

14.
个性化微博推荐算法   总被引:5,自引:0,他引:5  
微博不同于传统的社会网络和电子商务网站,存在用户活跃程度低,微博数据稀疏和用户兴趣动态变化等特点,将传统推荐算法应用于微博推荐时,效果并不理想。提出了一种基于贝叶斯个性化排序的微博推荐算法,对用户进行个性化微博推荐。该基于贝叶斯个性化排序的微博推荐算法,以微博对的形式提取微博系统中的隐式信息,对这些微博对进行学习,从而得到用户对不同微博的兴趣值。根据每条微博发出的时间,估计每条微博对的可信度。发出时间越接近的微博对,它的可信度就越高,并且对用户的兴趣值影响就越大。在新浪微博的真实数据上进行实验和评测,结果表明该基于贝叶斯个性化排序的微博推荐算法相比于对比算法,在进行微博推荐时有更好的效果。  相似文献   

15.
可分性判据在中文网页分类中的应用   总被引:3,自引:0,他引:3  
提出了一种改进的基于统计的中文网页的分类算法。通过对传统的基于计算相似度文本分类方法和基于贝叶斯模型文本分类算法的研究,我们对贝叶斯模型分类算法进行了改进,提出了利用一种基于概率分布的可分性判据分类方法,即用类别密度函数似然比来增加特征词的可分性信息的算法。通过对计算相似度方法,贝叶斯方法及改进的贝叶斯方法的对比实验表明,改进算法可以使类与类的间隔最大化,因而具有较高的分类精确率和召回率。  相似文献   

16.
多Agent自动协商中机器学习的应用研究   总被引:2,自引:0,他引:2  
目前将机器学习理论应用到多Agent自动协商系统中已成为电子商务领域的最新研究课题。本文即是利用贝叶斯法则来更新协商中的环境信息(即信念),利用强化学习中的Q学习算法生成协商中的提议,建立了一个具有学习机制的多Agent自动协商模型。并且封传统Q学习算法追行了扩充,设计了基于Agent的当前信念和最近探索盈余的动态Q学习算法。实验验证了算法的收敛性。  相似文献   

17.
为了减少自动光学检测系统对用户经验的依赖,提出了一种基于统计分析的PCB组装缺陷特征学习方法。该方法通过对良品和不良品样本图像的统计学习优选出分类能力强的特征,再采用最小风险贝叶斯决策得到特征分类参数。实验结果表明,该算法有效地简化了用户检测程序的编程和调试,提高了AOI的使用效率和准确率。  相似文献   

18.
赵悦  穆志纯 《计算机工程》2006,32(24):23-25
结合委员会成员投票熵和相对熵,改进了基于委员会选择算法(QBC)的主动学习,并应用基于该算法的主动贝叶斯网络对电信客户信用风险分类进行建模。实验结果表明,提出的基于改进的QBC主动贝叶斯网络分类器所建模型比原有算法有更好的分类精度,并且使用了少量的训练数据。  相似文献   

19.
针对信息检索中如何提高检索的精度问题,提出了一个基于相关反馈的视频检索算法.使用概率框架来描述检索问题,并根据贝叶斯学习按照用户的行为来更新概率分布,实现自动相关反馈,提高了检索精度.实验表明,用该算法检索的准确度比基于最近邻特征线(NFL)的视频检索方法有明显提高.  相似文献   

20.
在垃圾邮件分类和朴素贝叶斯算法研究的基础上,提出了基于用户知识的贝叶斯分类算法.通过在分类过程中引入用户知识,克服了电子邮件内容是非结构化、解读依赖于用户的问题.实验证明,面向用户知识的贝叶斯分类算法在商业邮件分类中比普通贝叶斯算法有更好的性能.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号