首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 156 毫秒
1.
提出了一种基于遗传算法的受限制BAN分类器算法-GBAN(genetic algorithm based BAN)。新算法采用了遗传算法进行网络结构的学习,限制了所学习的BAN分类器结构的复杂度。同时对TAN分类器的结构进行了扩展,得到了一种受限制的BAN分类器。针对这种分类器的结构学习,设计了结合对数似然的适应度函数及相应的遗传算子,并给出了网络结构的编码方案,使得该算法能够收敛到全局最优的结构。实验结果表明,当数据集属性之间关系相对复杂的时候,GBAN比TAN的分类准确率高,分类效果较好。  相似文献   

2.
一种文本处理中的朴素贝叶斯分类器   总被引:22,自引:0,他引:22  
首先在特征独立性假设的基础上,讨论了朴素贝叶斯分类器的原理,以及训练朴素贝叶斯分类器和应用朴素贝叶斯分类器进行分类的问题。然后,通过EM算法(期望值最大算法),自动增加训练量,以得到较为完备的训练文本库,扩展了朴素贝叶斯分类器的应用,提高了朴素贝叶斯分类器的分类精度。文章最后给出一组实验数据。本文的研究发现,朴素贝叶斯分类器分类精度较高,并且不存在单分类器与多分类器的实现差异,是一个比较实用的分类器。  相似文献   

3.
空间支持向量域分类器   总被引:2,自引:0,他引:2  
构造了一种空间支持向量域分类器(SSVDC).在训练阶段分别对正负两类样本进行支持向量域描述,根据描述边界将数据空间划分为互不相交区域,并设定相应的分类准则.在测试阶段,分别计算待识别样本与两个最小包围超球球心的距离,根据其与超球半径的大小关系确定待识别样本所处区域,并采取相应分类准则完成分类.UCI数据集上的多个数值实验表明,与支持向量机(SVM),支持向量域分类器(SVDC)相比,SSVDC具有好的鲁棒性,训练时间可缩短为SVM的20.6%,分类精度比SVDC提高45.9%.  相似文献   

4.
Adaboost算法可以将分类效果一般的弱分类器提升为分类效果理想的强分类器,而且不需要预先知道弱分类器的错误率上限,这样就可以应用很多分类效果不稳定的算法来作为Adaboost算法的弱分类器.由于BP神经网络算法自身存在的局限性和对训练样本进行选择的主观性,其分类精度以及扩展性有待提高.将Adaboost算法与BP神经网络相结合,使用神经网络分类模型作为Adaboost算法的弱分类器.算法在matlab中实现,对2个UCI的分类实验数据集进行实验,结果表明Adaboost能有效改善BP神经网络的不足,提高分类正确率和泛化率.  相似文献   

5.
基于随机子空间的多分类器集成   总被引:2,自引:0,他引:2  
提出了一种基于随机子空间的多分类器集成算法RFSEn.首先选择一个合适的子空间大小,然后随机选择特征子集并投影,并得到子空间上的基分类器,从而通过基分类器构成集成分类器,并由集成分类器来进行文本的分类.将该算法与单一分类器和基于重抽样技术的bagging算法进行了比较,在标准数据集上进行了实验.结果表明,该方法不仅优于单一分类器的分类性能,而且一定程度上优于bagging算法.  相似文献   

6.
机器学习与数据挖掘是研究从数据中提取知识的理论和技术,目前这些理论与技术在世界主要经济领域中日益得到广泛应用。分类模型是机器学习和数据挖掘最重要的研究内容之一。在众多的分类方法中,贝叶斯分类器在计算上具有非常高的效率,在某些应用问题上表现出诱人的分类精度,因而广泛地应用于许多实际领城中。为进一步对这一领域展开研究,介绍了贝叶斯分类器的原理、当前现状及下一步的研究重点。  相似文献   

7.
基于多支持向量机分类器的增量学习算法研究   总被引:1,自引:0,他引:1  
为了将一般增量学习算法扩展到并行计算环境中,提出一种基于多支持向量机分类器的增量学习算法.该算法根据多分类器对新增样本集的分类结果,以样本到分类超平面的平均距离为条件重新构造支持向量集更新分类器,直到所有分类器的分类精度满足指定阈值.实验结果表明了该算法的可行性和正确性.  相似文献   

8.
文档的高维性导致朴素贝叶斯文本分类器的复杂度较高,进而影响到文本分类的效率和精度.针对这一问题,首先采用k-means算法对单词进行聚类,将得到的单词簇视为文本特征,再使用朴素贝叶斯分类器进行文本分类.实验表明:基于簇的分类方法在分类精度和效率上均优于基于单词的分类方法.  相似文献   

9.
为了在并行计算系统中应用支持向量机,提出一种基于多支持向量机分类器的并行学习算法.分析了w-model算法的不足,并在训练过程中采用循环式反馈更新各支持向量机分类器以避免样本的分布状态对各分类器性能的影响,提高各分类器的训练精度.学习过程以平均分类精度为阈值,对部分分类器重新训练,实现对多分类器学习系统性能的全局优化.在UCI标准测试数据集上进行的实验结果表明,循环式反馈能有效地平衡多分类器学习性能相差过大的问题,算法较w-model具有更高的训练效率和分类效率.  相似文献   

10.
文本分类是数据挖掘领域中重要的研究分支.通过对自适应遗传算法和朴素贝叶斯分类器的研究,提出一种基于自适应遗传算法的朴素贝叶斯分类算法.将该算法应用于中文文本分类中,可以生成最优贝叶斯分类器及最优属性集合,提高分类精度.  相似文献   

11.
针对多标签AdaBoost系列算法,以尽量减小算法的学习错误率为目的,提出了对其进行改进的两种思路。基于改进思路构造出了改进的多标签AdaBoost算法。一种思路是修改算法的样本分布调整策略,破坏现有AdaBoost算法中样本分布的均匀性,以确保增加每一个弱分类器都能降低学习错误的上界估计,从而实现对多标签AdaBoost算法的改进。另一种思路是训练弱分类器时兼顾后续待学习的弱分类器对学习错误的影响,克服现有算法在训练弱分类器时只考虑当前的弱分类器对学习错误的影响,而完全忽略后续待学习的弱分类器对学习错误的影响这一现象,从而改进多标签AdaBoost算法。理论上,对于改进多标签AdaBoost算法,增加每一个弱分类器都能进一步降低学习错误。理论分析和实验结果均表明了提出的改进算法有改进效果。  相似文献   

12.
提出了一种基于机器学习的多变量制造过程中的关键变量检测算法.该算法利用机器学习分类器对多变量制造过程进行数学建模,以随机打乱过程变量后分类器的性能变化作为评价指标,检测导致产品质量相对异常的关键变量.设计并生成了多变量制造过程的仿真数据集,在仿真数据集和基于中国某工厂的2个实际生产案例数据集上对算法的检测性能进行了性能验证,2次验证结果均表明算法检测性能良好.  相似文献   

13.
在多示例学习中,当训练样本数量不充足或者训练样本中存在噪声信息时,分类器的分类性能将降低.针对该问题,本文提出了一种基于抗噪声的多任务多示例学习算法.一方面,针对训练样本中可能存在的噪声问题,该算法赋予包中示例不同的权值,通过迭代更新权值来降低噪声数据对预测结果的影响.另一方面,针对训练样本数量不充足问题,该算法运用多任务学习策略,通过同时训练多个学习任务,利用任务间的关联性来提高各个分类任务的预测性能.实验结果证明,与现有的分类算法相比,该方法在相同的实验条件下具有更优秀的性能.  相似文献   

14.
&#  &#  &#  &#  &# 《西华大学学报(自然科学版)》2015,34(6):53-57
为提高网络入侵检测的分类效率,提出一种结合主动学习和半监督学习的入侵检测算法。结合入侵检测实际,对主动学习算法进行简化,用有标记样本训练生成2个分类器,实现对未标记样本的预测;将2个分类器预测不一致的未标记样本作为信息量丰富的样本,使用半监督学习算法进行标记;最后, 把新增加的新标记样本添加到主动学习和半监督学习的训练集中,训练各自分类器, 反复迭代直到未标记样本集为空, 并用最新的有标记样本集训练形成最终的分类器。使用KDD CUP 99数据集进行入侵检测实验,其结果表明,与SVM方法相比,其分类率提高了4.3%,且较好地缩减了问题规模。    相似文献   

15.
针对传统分类方法的局限性,提出了一种深度学习结合知识挖掘的零样本图像自适应控制图像分类算法.利用对图像属性的深度学习来实现图像深层次特征及属性的学习和预测,基于图像的属性-类别映射使分类器性能有较大差异,通过稀疏表示模型挖掘图像类别和属性之间的关系并设计自适应控制的属性分类器实现对图像的分类操作.结果表明,与DBN和SVM算法相比,在监督模式和零样本模式下,该算法具有较高的属性预测准确度.在零样本情况下对Shoes数据集进行分类时,该算法具有最高的准确分类识别率,比其他算法的分类识别率提高了15%.  相似文献   

16.
针对现有算法没有涉及的宽带环境下多路摩尔斯信号自动检测问题,提出一种基于宽带时频图和集成学习分类器的算法.首先,通过提出一种基于宽带时频图的信号快速窄带滤波方法,实现噪声背景中各类型信号窄带时频图的快速获取;然后,为从上述窄带时频图中识别出多路摩尔斯信号,提出3个新特征与局部二值模式特征构成特征向量;最后,采用集成学习算法设计分类器实现摩尔斯信号的自动检测.与现有算法对比实验结果表明:针对多组实际数据,该算法的正确率均可达95%以上,同时误检率低于10%,具有良好的鲁棒性和应用价值.  相似文献   

17.
改进的球结构SVM多分类增量学习算法   总被引:1,自引:0,他引:1  
针对球结构支持向量机(support vector machine,SVM)增量学习算法在训练时间和分类精度上的不足,提出了一种改进的球结构SVM多分类增量学习算法.该算法首先构造一个完全二叉树用于多类分类;分析新增样本的加入对原支持向量集的影响,将新增样本集中部分样本和原始训练集中的支持向量以及分布在球体一定范围内的样本合并做为新的训练集,完成分类器的重构.实现通过减少训练样本缩短训练时间和完善分类器提高分类精度的目的.通过UCI标准数据集实验,结果表明,该算法在所需训练的样本数、训练时间以及准确率3方面都优于球结构SVM增量学习算法,尤其当样本分布不平衡时,该算法有更高的分类准确率.  相似文献   

18.
提出一种基于主动学习的微钙化簇区域检测新算法,利用方向差分滤波器组对微钙化区域进行增强和特征提取,同时抑制高亮血管和导管等复杂区域的干扰; 利用基于Bootstrap的主动学习样本方法进行样本选择和分类器训练; 采用训练后的分类器实现乳腺X-线图像中钙化簇区域检测.实验结果表明,相对于被动学习的分类器检测效果,新算法在保持检出率的同时使假阳性率降低了约4.7%,取得了较好的检测效果.  相似文献   

19.
为提高半监督分类的性能,提出一种安全的基于分歧的半监督分类算法Safe Co-SSC。通过有标记样本训练3个有监督分类器,利用无标记样本的信息增加分类器的差异性,采取3个分类器加权投票的策略实现对无标记样本的伪标记;对伪标记样本进行二次验证,选用能使分类器误差减小的新增标记样本扩充标记样本集。保证新样本的添加既减小了分类器的分类误差,又提高了分类器的分歧性。对UCI数据集进行分类实验的结果表明,该算法具有较高的分类率和样本标记率。    相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号