首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
一种基于朴素贝叶斯分类的特征选择方法   总被引:11,自引:0,他引:11  
由于朴素贝叶斯文本分类中的独立假设前提,使得在特征选择步骤能否准确有效地选出能代表文本的特征显得尤为重要,而特征选择标准中的MI标准与TFIDF标准其优缺正好互补,因此在用朴素贝叶斯文本分类方法中的多项式模型实现了一个web页面分类系统-WEBCAT的基础上,提出将MI标准与TFIDF标准结合进行特征选择.实验显示:用改进的方法可以更准确地选出能代表文本的特征,文本分类结果也比单独使用TFIDF标准或单独使用MI标准进行特征选择的分类结果更加精确.  相似文献   

2.
一种基于粗糙集的朴素贝叶斯分类算法   总被引:3,自引:0,他引:3  
朴素贝叶斯分类器的计算过程只有在完全数据库中才成立,而基于相似关系的粗糙集模型具有处理空值的功能,并且提供了属性离散化和约简技术,可以改善属性间的依赖关系。因此,将两种不同的软计算方法相结合,利用粗糙集合理论先把决策表补齐,再对数据进行约简,然后结合朴素贝叶斯分类器,得出分类结果。实验证明这种方法不仅简化了数据和模型的规模,也具有对不完全数据的分类能力。  相似文献   

3.
朴素贝叶斯分类方法是一种广泛使用的分类算法,在独立性假设不完全满足的情况下计算效率和分类效果均较为理想.通过分析全局特征向量中各特征与类别属性之间的联系,提出将组合特征置换多源特征,用组合特征的共现率对多源特征进行概率调整的新方法,在不同数据集的实验中,调整后的朴素贝叶斯分类器(FRNB)的分类精度均好于传统朴素贝叶斯分类器.测试结果表明,改进后的算法是有效可行的.  相似文献   

4.
朴素贝叶斯算法因其分类精度高、模型简单等优点而被得到普遍应用,但因为它需要具备很强的属性之间的条件独立性假设,使得其在实际分类学习中很难实现.针对这个缺点,提出了一种基于遗传算法的加权朴素贝叶斯分类算法(G_WNB).该算法将遗传算法(GA)与加权朴素贝叶斯分类算法(WNB)相结合,首先使用基于Rough Set的加权朴素贝叶斯分类算法,综合信息论与代数论给出的属性权值求解方法,计算出每个属性的权值,以初始权值作为初始种群,加权朴素贝叶斯的分类正确率为适应度函数,采用遗传算法优选,以使适应度函数最高的权值为数据集的最终权值,最后使用G_WNB进行分类.实验表明,该算法提高了分类准确率,同时提高了朴素贝叶斯分类器的性能.  相似文献   

5.
 空间分类是空间数据挖掘的重要分支,寻找高效的空间分类算法是空间分类研究的重要方向.在空间对象的邻接图及朴素贝叶斯分类法的基础上提出一个新的空间分类算法,该算法对空间对象进行分类时,既考虑了待分类对象的属性对分类的影响,又考虑了其空间邻接对象对它分类的影响.该算法的计算复杂度不高,分类的正确性好.  相似文献   

6.
朴素贝叶斯分类器是一种简单而高效的分类器,但它的条件独立性假设影响了它分类的正确率.加权朴素贝叶斯是对它的一种扩展.通过分析属性相关性的度量和属性约简,选择一组最近似独立的属性约简子集,并结合加权朴素贝叶斯和选择性贝叶斯分类器的优点,提出一种选择性的加权贝叶斯分类器SWNBC.实验结果表明,与朴素贝叶斯分类器相比,WSANBC分类器具有较高的分类正确率.  相似文献   

7.
本文通过分析属性相关性的度量和属性约简,提出一种基于属性相关性度量的朴素贝叶斯分类模型EANBC。实验结果表明,与朴素贝叶斯分类模型相比,EANBC分类模型具有较高的分类正确率。  相似文献   

8.
利用加权核Fisher准则,给出一种朴素贝叶斯分类器的改进算法。该算法通过寻找使类与类最大分离的最优投影矩阵,将样本数据进行投影变换,再利用朴素贝叶斯分类器对新样本进行分类。将该方法应用于双酚A生产过程在线监测数据集的分类中,仿真结果表明,相比于单纯朴素贝叶斯分类器,该分类算法具有更好的分类性能。  相似文献   

9.
朴素贝叶斯分类算法以其简单、高效等优点一直是分类算法的研究热点之一。但是它的条件独立性假设不能很好的表现多数现实应用中变量之间存在的依赖关系,从而影响它的分类效果。针对这一问题,提出了一种改进算法,该算法通过基于协方差和卡方拟合统计量的思想来确定权重系数。实验结果表明,与朴素贝叶斯算法相比,对于分类正确率有一定的提高。  相似文献   

10.
空间分类既要考虑待分类对象的非空间属性,还要考虑其空间邻接对象非空间属性对分类的影响.提出一种基于多关系的朴素贝叶斯空间分类算法,算法将多关系分类方法用于空间分类,考虑了不同近邻对象的非空间属性对分类产生的影响,其分类准确率高于单关系朴素贝叶斯空间分类算法.算法可以用于空间数据库中的大数据集,不需要复杂的数据预处理.  相似文献   

11.
贝叶斯分类算法存在一个不足之处,即在搜索空间添加属性时与属性的顺序无关,导致在添加几个相关的属性时留下的属性不能具有最优的分类性能.提出的一种选择性朴素贝叶斯算法,先按照属性信息增益值的大小对属性进行排序,然后再对属性进行选择,从而能够提高分类的准确率.  相似文献   

12.
关系朴素贝叶斯分类算法对于目标关系表和背景关系表中不同的记录关联方式采用不同的策略,灵活运用连接和元组ID传播技术,高效地实现了将背景关系表中的信息加入到目标关系表中一起考虑来进行分类,提高了分类正确率。该算法采用关系数据库的数据表示方式,解决了传统的朴素贝叶斯算法不能支持关系数据库的问题。  相似文献   

13.
室内无线定位以其低成本、高普适性等优点成为用户定位研究领域的热点,针对现有基于位置指纹数据库的室内无线定位算法,因室内环境复杂存在定位精度低、数据通信能耗大等问题,提出一种Voronoi图和朴素贝叶斯定位相结合进行无线地图(指纹数据库)构造的算法模型。首先,建立两级校准点模型,一级校准点为预先选择且进行收集RSSI(Received signal strength indicator)样本,在此基础上通过无线传播模型计算得到二级校准点;然后,对无线地图进行Voronoi区域生成,每个Voronoi图包含一个一级校准点和多个二级校准点;最后,在匹配得到的Voronoi区域内运行朴素贝叶斯算法,获得定位目标的估计位置。实验结果表明,提出的算法模型能降低收集RSSI数据的成本,同时提高目标定位精度,具有一定的应用价值。  相似文献   

14.
朴素贝叶斯模型具有的简单性和有效性,使其在诸多问题领域表现出优良的性能,但其属性条件独立性假设在实际应用中难以成立.而属性加权是降低属性条件独立性假设对分类器性能影响的主要途径.传统建立在整个数据集上的单一全局模型忽略了每个测试实例所具有的特点,同时从整个训练集上学习到的属性权重并不能准确反映每个属性对待分类实例的影响.为此提出一种基于数据驱动的懒惰式局部属性加权方法,它在每个测试实例的近邻集合上学习属性权重,并通过最优化方法建立相应的局部属性加权朴素贝叶斯模型.实验结果表明:和当前常见的准朴素贝叶斯模型相比,本文模型具有较高的分类准确率.  相似文献   

15.
基于广义朴素贝叶斯分类器的空值处理方法   总被引:1,自引:1,他引:0  
给出了基于广义朴素贝叶斯分类器的空值处理方法,该方法利用广义朴素贝叶斯分类器的较强预测能力及灵活的效率选择方式,有效地解决了数据中的空值处理问题.利用模拟数据进行了对比实验,结果显示,其预测准确性明显提高.  相似文献   

16.
为解决车辆在相对高速运动下产生网络间切换的“乒乓效应”,根据隐朴素贝叶斯分类思想,突破原有贝叶斯决策中关于属性之间完全独立的假设,建立属性间的关系,同时引入自适应修正概率,降低切换次数,避免了运算的复杂度。仿真结果表明,改进算法与原算法及其他算法相比较,可以有效降低切换次数,并且拥有更低的运行时间,提升了在车联网环境下垂直切换的稳定性与效率。  相似文献   

17.
接触图路由(CGR)是星际网络路由协议中的一个重要组成部分,星际网络中节点易受电磁干扰或自身资源不足影响而失效,高度依赖先验知识的接触图路由在节点意外失效时通信性能会急剧恶化。针对上述问题,提出了在接触图路由中引入朴素贝叶斯学习模型来预测节点可靠性的方法。首先根据接触图路由的特点建立节点快照;然后基于节点快照进行朴素贝叶斯建模,预测节点间的不可靠性概率;最后在路由决策时考虑不可靠性概率,选择不可靠性小的节点转发数据。实验结果表明,引入朴素贝叶斯学习可以有效提高接触图路由在恶劣的太空环境中应对节点意外失效的能力,实现对数据的高效传输。  相似文献   

18.
通过对甘肃省档案局数据资源的分析研究,并与朴素贝叶斯分类算法相结合,实现对档案资源分类应用的研究.根据档案数据的特征,选用TFIDF(term frequency-inverse document frequency)算法进行选取符合档案文本主题的属性.样本实验结果证明,该分类模型适用于档案文本资源的分类,实现了档案资源自动分类的功能.相较于传统朴素贝叶斯分类方法,所提出的分类模型针对档案资源的分类效率提高了1%~2%.  相似文献   

19.
朴素贝叶斯分类器在机器学习领域中一种重要的分类算法,但是该算法的前提是:要求数据集在给出分类属性的情况下,其他属性之间是独立的。根据这个前提,利用Foley-Sammon变换算法进行特征提取,提出了一种基于Foley-Sammon变换的朴素贝叶斯分类器NBFST(Naive Bayesian classifier with Foley-Sammon Transform)。实验表明,NBFST能够在大多数数据集上具有较高的分类准确率。  相似文献   

20.
先用投影算子将线性互补的Signorini边界转换为等价的不动点方程,然后将Signorini问题转化为边界积分方程,用无网格边界点方法求解该问题,提出一种无网格边界积分方程方法。丰富了无网格边界积分方程方法,继承了无网格方法的优点和强显式投影迭代格式的特点,最后通过数值算例说明该方法收敛有效。
  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号