首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 875 毫秒
1.
模式分类旨在依据识别对象特征的观察值将其归并至某个类别,贝叶斯分类决策可实现模式分类.给出一类遵从特征观察量独立性假设的贝叶斯分类器即朴素贝叶斯分类器设计.并给出朴素贝叶斯分类器的分类误差估计方法.理论分析与实验结果表明,朴素贝叶斯分类器设计方案可行,且其分类误差估计方法有效,可用于模式分类事务处理.  相似文献   

2.
文本分类是数据挖掘领域中重要的研究分支.通过对自适应遗传算法和朴素贝叶斯分类器的研究,提出一种基于自适应遗传算法的朴素贝叶斯分类算法.将该算法应用于中文文本分类中,可以生成最优贝叶斯分类器及最优属性集合,提高分类精度.  相似文献   

3.
一种文本处理中的朴素贝叶斯分类器   总被引:22,自引:0,他引:22  
首先在特征独立性假设的基础上,讨论了朴素贝叶斯分类器的原理,以及训练朴素贝叶斯分类器和应用朴素贝叶斯分类器进行分类的问题。然后,通过EM算法(期望值最大算法),自动增加训练量,以得到较为完备的训练文本库,扩展了朴素贝叶斯分类器的应用,提高了朴素贝叶斯分类器的分类精度。文章最后给出一组实验数据。本文的研究发现,朴素贝叶斯分类器分类精度较高,并且不存在单分类器与多分类器的实现差异,是一个比较实用的分类器。  相似文献   

4.
P2P应用软件检测技术主要是深度包检测法和深度流量检测法.深度包检测法不能检测出加密的和未知的对等网络流应用,深度流量检测方法可以克服深度包检测法这个缺点.将模糊识别领域里比较成熟的贝叶斯分类技术应用到对等网络深度流检测中.结合实际项目,对贝叶斯的两个分类器-朴素贝叶斯和全贝叶斯的算法、训练结果、运行结果进行研究,实验研究表明朴素贝叶斯和全贝叶斯分类器能够快速准确地找到P2P流应用,朴素贝叶斯分类器准确度占据优势,全贝叶斯运行时间占据优势.  相似文献   

5.
针对不确定性数据的分类问题,提出一种基于直方图估计的不确定性朴素贝叶斯分类器(HU-NBC).基于直方图估计的思想,建立估计不确定性数据概率密度函数的数学模型,并利用该模型估计不确定性朴素贝叶斯分类器的类条件概率密度函数.实验结果表明,与同类型算法相比,基于直方图估计的HU-NBC算法拥有较优的分类精度、较小的时间代价和空间需求,适合解决数据量较大的不确定性数据分类问题.  相似文献   

6.
通过对不同空间碎片的光谱进行分析,实现对不同空间碎片的识别和分类。采用了移动平均光滑法和最大最小归一化对原始空间碎片光谱进行预处理,然后运用概率神经网络对经预处理后的空间碎片光谱进行分类。预测结果表明,移动平均平滑和归一化结合概率神经网络的空间碎片分类识别准确率达到了99.23%,说明文中提出的基于光谱技术的识别方法具有很好的分类能力。  相似文献   

7.
在对未知应用静态分析的基础上,提取AndroidManifest.xml中申请的权限为特征,采用信息增益算法优化选择分类特征,再采用拉普拉斯校准、乘数取自然对数改进的朴素贝叶斯算法创建恶意应用分类器.通过十折交叉试验验证改进的朴素贝叶斯分类器的准度和精度较高,且通过信息增益优化选择的分类特征在保障准确率的情况下能有效提高检测效率.与k最近邻和k-Means分类器相比,改进的朴素贝叶斯分类器具有较好的分类效果.  相似文献   

8.
朴素贝叶斯分类器是一种简单高效的分类算法,但其属性独立性假设影响了分类效果。通过放松朴素贝叶斯假设可以增强朴素贝叶斯的分类效果,但是通常会导致计算代价大幅提高。针对以上问题,提出了一种基于粗糙集的特征加权朴素贝叶斯算法,加权参数直接从训练数据中学习得到,可以看作是计算某个后验概率时,某个特征对于该类别的影响程度。将该分类算法与朴素贝叶斯分类器(na ve bayesian classifier,NB)、贝叶斯网(bayes networks)和NBTree分类器进行实验比较。结果表明:在大多数数据集上,FWNB分类器在较小的计算代价下,具有较高的分类正确率。  相似文献   

9.
为解决路面积雪状态(轻微、严重)检测问题以保证行车安全,利用监控视频得到路面实时状态,采用朴素贝叶斯分类方法进行积雪状态检测。首先利用机器视觉和视频目标分割方法提取视频中路面视觉特征,然后采用朴素贝叶斯分类方法进行路面积雪状态分类,通过实验,综合比较了朴素贝叶斯分类与KNN分类、人工神经网络(ANN)、支撑向量机(SVM)在路面积雪状态检测问题中的有效性,结果表明,朴素贝叶斯分类器更适合积雪状态的分类。  相似文献   

10.
中文微博情感分析中主客观句分类方法   总被引:2,自引:0,他引:2  
采用朴素贝叶斯分类器对微博语句的主客观分类问题进行研究。首先分析微博文本和其他文本的主要区别,并针对微博文本的表述特点提取一些主客观线索特征,然后对2-POS模式的最佳选取方式进行研究,最后以特征词和主客观线索做语义特征,2-POS模式做语法特征,采用朴素贝叶斯分类器分别研究它们对分类结果的影响。实验结果表明,同时考虑语义特征和语法结构特征的分类效果比仅考虑一种特征时要好。  相似文献   

11.
对于极化合成孔径雷达(SAR)图像,由于雷达角度和地物形状导致属于同一类的数据可能存在较大的差异性.针对此问题提出了一种基于贝叶斯集成框架的极化SAR图像分类方法.该算法采用贝叶斯集成,通过学习不同个体而获得的分类面来改善极化SAR图像分类性能.首先,输入极化SAR图像,并获得其对应的极化SAR数据及特征.从图像的每一类中任意选择像素点作为图像分类的原始训练样本,并对其进行随机划分获得不同的样本子集.然后,基于获得的样本子集构造对应极化SAR图像的贝叶斯集成框架.最后,通过构造的贝叶斯集成框架对极化SAR图像进行分类.特别在构造贝叶斯集成框架中采用支撑矢量机作为基本的分类器算法.实验结果表明,所提出的算法相比经典的极化SAR分类方法和单个SVM的极化SAR分类方法获得更好的分类性能.  相似文献   

12.
考虑因子数据的数据特征,采用连续属性服从正态分布的朴素贝叶斯分类方法,对因子分析降维前后数据集的分类性能变化进行了研究.实验结果表明:因子分析中的KMO(Kaiser-Meyer-Olkin)统计值和变量共同度与分类性能紧密相关,当KMO统计值大于0.8,并且只有很少属性的变量共同度值小于80%时,采用因子分析作为分类之前的降维是适宜的.  相似文献   

13.
基于朴素贝叶斯的电网用户行为分析   总被引:1,自引:0,他引:1  
针对电网数据利用率低、精度低、分析结果粗糙和分析层面浅等问题,提出了一种基于朴素贝叶斯分析的电网用户行为分析方法.使用模糊C均值聚类将电网用户的用电数据聚类为不同的用电模式,使用朴素贝叶斯分类器将用户的用电行为分为不同的类别,提取出其中主要的用电模式.某纺织企业的48点负荷数据仿真与测试结果表明,所提出方法在分析用户用电模式时的有效性良好,为电力系统的调控与运行提供了一种合理、有效的方法.  相似文献   

14.
基于随机森林的流量分类方法   总被引:1,自引:0,他引:1       下载免费PDF全文
网络流量识别在提高网络管理能力和保护网络安全方面有着重要作用。传统的基于端口识别和深度包检测的方法由于无法应对端口随机化、数据加密等原因,识别效率大大降低。近年来,出现了基于流统计特征的识别方法。然而,已有的基于流统计特征的识别方法大多使用单个分类器进行流量识别,存在着精度提高难、环境依赖强等局限性。针对这一问题,提出一种基于随机森林的流量分类方法,基于多分类器集成的思想,采用由多个决策树集成、由随机向量决定决策树构造方式的随机森林,实现对网络流量的分类。实验分析结果表明,所提出方法的分类性能优于常见的基于C4.5和Naive Bayes的流量分类方法。  相似文献   

15.
关联性识别对于系统演化规律的确定意义重大,从测试数据累积、更新的视角,针对皮肤指标与中医体质之间的关联性进行探索,构建分类模型。提出基于建模数据动态修订决策树和模糊朴素贝叶斯融合算法的权重,建立具有较好分类及解释性的分类模型。其中决策树采用最佳后剪枝方式,避免过拟合弊端;朴素贝叶斯算法则通过定义指标归属区间的模糊隶属度来解决属性分类中存在的随机与模糊性。实证结果表明随着建模数据的变化,分类模型的融合权重动态调整,目前模型的准确率为86.7%,高于独立决策树、朴素贝叶斯的83.3%和80%,亦高于对照组小数据分类模型的76.7%。可见此动态分类模型可有效利用参与建模的数据信息识别出外在皮肤与内在体质之间的关联性,为皮肤-体质间的定量研究奠定了基础。目的:针对人体面部皮肤状态指标与中医体质类型之间的关联性进行科学、定量研究,从测试数据持续累积与知识发现深入推进的过程视角,尝试揭示人体内在中医体质与外观皮肤状态指标间的复杂动态演化规律。方法:本文综合小样本条件下决策树的良好归纳特性及大样本条件下贝叶斯算法分类准确率高的优势。提出基于建模数据量会不断增多的趋势,构建可自适应修订决策树和模糊朴素贝叶斯融合分类算法的权重,以适用于测试数据从小到大积累过程中分类模型均具有较好分类特性及可解释性的应用要求。其中决策树采用最佳后剪枝方式,避免了常规决策树存在的过拟合弊端;朴素贝叶斯算法则通过定义指标归属区间的模糊隶属度来解决皮肤属性测试与分类中存在的随机性与模糊性。结果:实证结果表明本文提出的分类模型的融合权重可动态调整且随着建模数据的增多分类精度会相应提高。目前对应151个建模数据的分类模型的分类准确率为86.7%,高于独立决策树、朴素贝叶斯的83.3%和80%,亦高于对照组80个建模数据对应分类准确率的76.7%。结论:可见此皮肤—体质动态分类模型通过有效利用参与建模的数据信息,能识别出人体面部外观皮肤状态指标与内在中医体质之间的复杂关联性,建立的分类模型具有较好的精度与可解释性,为基于数据驱动的中医理论的科学化、智能化发展进行了有益的探索。  相似文献   

16.
为了解决传统串行朴素贝叶斯算法分类性能低下的问题,提出一种基于朴素贝叶斯算法的并行化分类方法。选取多项式朴素贝叶斯,搭建Hadoop集群,通过卡方检验选取特征词,利用词频-逆文本频率指数方法计算出每个特征项的权值,并求出每类的权重总和,将权值应用到朴素贝叶斯公式中得到分类结果。实验结果表明:在该集群上设计的并行化朴素贝叶斯分类方法较比传统朴素贝叶斯方法,其精确率,召回率,F1值分别至少提高了7.66%,7.56%,11.98%,且用时更短,说明本文的方法能够提高处理文本的时间效率。  相似文献   

17.
针对传统网页分类中存在的准确率和查全率不高、分类效率低的情况,提出一种基于朴素贝叶斯分类的网页预分类算法.算法根据用户的网上活动情况提取相关网址,分析网页内容和网页关键词,利用朴素贝叶斯分类算法进行分类,根据用户对各类网页的浏览情况分析用户的行为特征.采用改进的文本权值计算方法,并引进网址预分类机制,提高数据的处理效率以及分类的准确率.结果表明,网址分类算法准确,能够充分发掘用户的兴趣喜好,可以作为用户行为分析的数据算法进行商业推广和司法取证.  相似文献   

18.
针对贝叶斯(Naive Bayes,NB)分类器的集成学习方法,研究如何提高分类器集成中各成员分类器之间的多样性,同时提高分类器系统准确率。实现方法是把训练集的所有属性特征划分特征子集,并处理所划分的属性特征子集,最后为每个成员分类器构造出不同的完整特征属性训练集。研究结果表明采用的NB集成方法(Ensemble of Naive Bayes,ENB)提高了分类性能,把ENB机器学习方法应用到自动图像标注中也获得了很好的效果。  相似文献   

19.
泥石流是山区典型的具有严重危害的地质灾害现象,若能实现对其提前预测预报将是十分有意义的.然而影响泥石流的因素错综复杂,本文综合考虑沟道纵比降、前期降水量、固体物质贮量三个必备因素对泥石流产生的影响,基于Bayes判别分析理论,利用泥石流资料作为训练样本,建立了泥石流预测的Bayes判别分析模型.预测结果表明,该模型结果与实际情况吻合良好,说明该模型在泥石流预测中具有良好的实用性和有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号