首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 171 毫秒
1.
一种新颖混合贝叶斯分类模型研究   总被引:2,自引:0,他引:2  
朴素贝叶斯分类器(Naive Bayesian classifier,NB)是一种简单而有效的分类模型,但这种分类器缺乏对训练集信息的充分利用,影响了它的分类性能。通过分析NB的分类原理,并结合线性判别分析(Linear Discriminant Analysis,LDA)与核判别分析(Kernel Discriminant Analysis,KDA)的优点,提出了一种混合贝叶斯分类模型DANB(Discriminant Analysis Naive Bayesian classifier,DANB)。将该分类方法与NB和TAN(Tree Augmented Naive Bayesian classifier,TAN)进行实验比较,结果表明,在大多数数据集上,DANB分类器具有较高的分类正确率。  相似文献   

2.
3.
通过分析朴素贝叶斯分类器与树扩张型朴素贝叶斯(TAN)分类器,提出了一种新的属性依赖度量方法,并依此对TAN分类器的构造方法进行了改进.将该分类方法(XINTAN)与朴素贝叶斯分类器和TAN分类器进行了实验比较.实验结果表明,此分类方法集中了朴素贝叶斯分类器与树扩张型朴素贝叶斯(TAN)分类器的优点,性能要优于TAN分类器.  相似文献   

4.
朴素贝叶斯分类器(Na(i)ve Bayes,NB)因其简单、高效的特性,被广泛应用于诸多领域,然而其属性独立的假设在现实世界往往并不成立.因此许多学者针对这个问题进行了大量的研究,其中较有代表性的算法有懒惰贝叶斯规则分类器(Lazy learning of Bayesian Rules,LBR),增强树贝叶斯分类器(Tree Augmented Naive Bayes,TAN)和平均单依赖分类器(Averaged One-Dependence Estimator,AODE).而AODE分类器以较快的训练速度和较好的分类精度尤为引人注日.该算法原理是:把所有单依赖分类器(Super Parent One-Dependence Estimator,SPODE)的预测概率加起来求平均,并以平均预测概率进行分类.这种简单求平均的集成方法没有考虑到每个SPODE贡献的大小,因此分类精度达不到最优.为了弥补这种不足,我们提出一种加权SPODE集成框架,为每个SPODE赋予合适的权值,权值通过优化算法计算得到.因为是在次优解的附近寻优,所以计算时问很短.实验表明新算法比NB、AODE、WAODE、LBR和TAN等算法具有更好的性能.  相似文献   

5.
陶建斌  舒宁  沈照庆 《遥感信息》2010,(2):18-24,29
提出了一种新的嵌入高斯混合模型(GMM,Gaussian Mixture Model)遥感影像朴素贝叶斯网络模型GMM-NBC(GMMbased Na ve Bayesian Classifier)。针对连续型朴素贝叶斯网络分类器中假设地物服从单一高斯分布的缺点,该方法将地物在特征空间的分布用高斯混合模型来模拟,用改进EM算法自动获取高斯混合模型的参数;高斯混合模型整体作为一个子节点嵌入朴素贝叶斯网络中,将其输出作为节点(特征)的中间类后验概率,在朴素贝叶斯网络的框架下进行融合获得最终的类后验概率。对多光谱和高光谱数据的分类实验结果表明,该方法较传统贝叶斯分类器分类效果要好,且有较强的鲁棒性。  相似文献   

6.
不同的入侵检测系统,使用不同的数据属性。朴素贝叶斯(Naive Bayes简称NB)分类器由于其强独立性假设,并未考虑属性之间的相互关系,而入侵检测的数据集不能很好地满足条件假设,本文引入隐藏贝叶斯网络分类器,并将其应用于入侵检测中。该模型为每一个属性创建一个隐藏的父属性,它能影响到分类器的其它属性。实验表明,该算法可以优化朴素贝叶斯模型,能提高入侵检测系统的整体性能,效果更好。  相似文献   

7.
TANC-BIC结构学习算法   总被引:1,自引:2,他引:1  
程泽凯  林士敏 《微机发展》2004,14(11):10-12
树扩展朴素贝叶斯分类器(TANC)是应用较广的一种贝叶斯分类器。TANC的分类性能优于朴素贝叶斯分类器(NBC)。现有的TANC结构学习算法是基于相关性分析的,采用互信息测度。贝叶斯信息测度(BIC)在基于打分和搜索的贝叶斯网络结构学习中取得了成功,文中用BIC测度来衡量属性结点之间的相关性,提出了一种新的TANC-BIC结构学习算法。在MBNC实验平台上编程实现了TANC-BIC算法,用分类准确率衡量算法的性能。实验结果表明,TANC-BIC算法是有效的。  相似文献   

8.
树扩展朴素贝叶斯分类器(TANC)是实用性较强的一种分类器,其性能优于朴素贝叶斯分类器。现有的TANC结构学习算法有基于互信息测度的相关性分析方法和贝叶斯信息测度(BIC)的搜索打分方法。将遗传算法引入TANC结构学习,用BIC作为评价函数,提出了基于BIC测度和遗传算法的TANC结构学习算法GA-TANC,并以此构建分类器,用分类准确率衡量算法的性能。实验结果表明,GA-TANC算法有更高的分类准确率,从而说明GA-TANC结构学习算法是准确有效的。  相似文献   

9.
树扩展朴素贝叶斯分类器(TANC)是应用较广的一种贝叶斯分类器.TANC的分类性能优于朴素贝叶斯分类器(NBC).现有的TANC结构学习算法是基于相关性分析的,采用互信息测度.贝叶斯信息测度(BIC)在基于打分和搜索的贝叶斯网络结构学习中取得了成功,文中用BIC测度来衡量属性结点之间的相关性,提出了一种新的TANC-BIC结构学习算法.在MBNC实验平台上编程实现了TANC-BIC算法,用分类准确率衡量算法的性能.实验结果表明,TANC-BIC算法是有效的.  相似文献   

10.
扩展的树增强朴素贝叶斯分类器   总被引:1,自引:0,他引:1  
树增强朴素贝叶斯分类器继承了朴素贝叶斯分类器计算简单和鲁棒性的特点,同时分类性能常常优于朴素贝叶斯分类器,然而在有连续变量的情况下要求必须进行预离散化.为了更好地表达数据的分布,减少信息损失,有必要考虑混合数据的情况.本文推导混合数据的极大似然函数,提出扩展的树增强朴素贝叶斯分类器,突破必须对连续变量进行预离散化的限制,能够在树增强朴素贝叶斯分类器的框架内处理混合变量的情况.实验测试证明其具有良好的分类精度.  相似文献   

11.
一种限定性的双层贝叶斯分类模型   总被引:29,自引:1,他引:28  
朴素贝叶斯分类模型是一种简单而有效的分类方法,但它的属性独立性假设使其无法表达属性变量间存在的依赖关系,影响了它的分类性能.通过分析贝叶斯分类模型的分类原则以及贝叶斯定理的变异形式,提出了一种基于贝叶斯定理的新的分类模型DLBAN(double-level Bayesian network augmented naive Bayes).该模型通过选择关键属性建立属性之间的依赖关系.将该分类方法与朴素贝叶斯分类器和TAN(tree augmented naive Bayes)分类器进行实验比较.实验结果表明,在大多数数据集上,DLBAN分类方法具有较高的分类正确率.  相似文献   

12.
朴素Bayes分类器是一种简单有效的机器学习工具.本文用朴素Bayes分类器的原理推导出“朴素Bayes组合”公式,并构造相应的分类器.经过测试,该分类器有较好的分类性能和实用性,克服了朴素Bayes分类器精确度差的缺点,并且比其他分类器更加快速而不会显著丧失精确度.  相似文献   

13.
惠孛  吴跃  陈佳 《计算机科学》2006,33(5):110-112
使用朴素的贝叶斯(NB)分类模型对邮件进行分类,是目前基于内容的垃圾邮件过滤方法的研究热点。朴素的贝叶斯在参数之间联系不强的时候分类效果简单而有效。但是朴素的贝叶斯分类模型中对特征参数的条件独立假设无法表达参数之间在语义上的关系,影响分类性能。在朴素的贝叶斯分类模型的基础上,我们提出了一种双级贝叶斯分类模型(DLB,Double Level Bayes),既考虑到了参数之间的影响又保留了朴素的贝叶斯分类模型的优点。同时时DLB模型与朴素的贝叶斯分类模型的性能进行比较。仿真实验表明,DLB分类模型在垃圾邮件过滤应用中的效果在大部分条件下优于朴素的贝叶斯分类模型。  相似文献   

14.
多种策略改进朴素贝叶斯分类器   总被引:7,自引:1,他引:7  
张璠 《微机发展》2005,15(4):35-36,39
朴素贝叶斯分类器是一种简单而高效的分类器,但是它的属性独立性假设使其无法表示现实世界属性之间的依赖关系,影响了它的分类性能。通过广泛深入的研究,对改进朴素贝叶斯分类器的多种策略进行了系统的分析和归类整理,为进一步的研究打下坚实的基础。  相似文献   

15.
贝叶斯分类算法是基于贝叶斯全概率公式的分类算法,是一种简单有效的分类方法.本文系统的介绍贝叶斯分类算法的原理及贝叶斯分类算法的特点,并重点阐述两种常用的贝叶斯分类算法模型及应用.  相似文献   

16.
基于模糊聚类和Naive Bayes方法的文本分类器   总被引:3,自引:0,他引:3       下载免费PDF全文
本文提出一种文本分类的新方法,该方法将模糊聚类与基于Naive Bayes的EM分类算法相结合,从而大大提高了EM分类算法的准确性,并解决了使用字符匹配引起的不完整性和不准确性问题。该方法首先给出每个类的一些关键词,并把这些关键词作为聚类中心进行聚类,然后使用距离聚类中心较近的文档启动一个引导过程。  相似文献   

17.
朴素贝叶斯分类器是一种简单而高效的分类器,但是其属性独立性假设限制了对实际数据的应用。提出一种新的算法,该算法为避免数据预处理时,训练集的噪声及数据规模使属性约简的效果不太理想,并进而影响分类效果,在训练集上通过随机属性选取生成若干属性子集,并以这些子集构建相应的贝叶斯分类器,进而采用遗传算法进行优选。实验表明,与传统的朴素贝叶斯方法相比,该方法具有更好的分类精度。  相似文献   

18.
操作风险数据积累比较困难,而且往往不完整,朴素贝叶斯分类器是目前进行小样本分类最优秀的分类器之一,适合于操作风险等级预测。在对具有完整数据朴素贝叶斯分类器学习和分类的基础上,提出了基于星形结构和Gibbs sampling的具有丢失数据朴素贝叶斯分类器学习方法,能够避免目前常用的处理丢失数据方法所带来的局部最优、信息丢失和冗余等方面的问题。  相似文献   

19.
Web page classification has become a challenging task due to the exponential growth of the World Wide Web. Uniform Resource Locator (URL)‐based web page classification systems play an important role, but high accuracy may not be achievable as URL contains minimal information. Nevertheless, URL‐based classifiers along with rejection framework can be used as a first‐level filter in a multistage classifier, and a costlier feature extraction from contents may be done in later stages. However, noisy and irrelevant features present in URL demand feature selection methods for URL classification. Therefore, we propose a supervised feature selection method by which relevant URL features are identified using statistical methods. We propose a new feature weighting method for a Naive Bayes classifier by embedding the term goodness obtained from the feature selection method. We also propose a rejection framework to the Naive Bayes classifier by using posterior probability for determining the confidence score. The proposed method is evaluated on the Open Directory Project and WebKB data sets. Experimental results show that our method can be an effective first‐level filter. McNemar tests confirm that our approach significantly improves the performance.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号