首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 593 毫秒
1.
&#  &#  &#  &#  &# 《西华大学学报(自然科学版)》2015,34(6):53-57
为提高网络入侵检测的分类效率,提出一种结合主动学习和半监督学习的入侵检测算法。结合入侵检测实际,对主动学习算法进行简化,用有标记样本训练生成2个分类器,实现对未标记样本的预测;将2个分类器预测不一致的未标记样本作为信息量丰富的样本,使用半监督学习算法进行标记;最后, 把新增加的新标记样本添加到主动学习和半监督学习的训练集中,训练各自分类器, 反复迭代直到未标记样本集为空, 并用最新的有标记样本集训练形成最终的分类器。使用KDD CUP 99数据集进行入侵检测实验,其结果表明,与SVM方法相比,其分类率提高了4.3%,且较好地缩减了问题规模。    相似文献   

2.
针对复杂交通场景车辆检测算法自适应能力差的问题,提出了基于Co-training半监督学习方法的车辆鲁棒检测算法.首先,针对手工标记的少量样本,分别训练基于Haar-like特征的AdaBoost分类器和基于HOG(histograms of oriented gradients)特征的SVM(support vector machines)分类器,使其具有一定的识别能力;然后,基于Co-training半监督学习框架,将利用2种算法进行分类得到的新样本分别加入到对方的样本库中,增加训练样本数量,再次进行分类器的训练.由于这2类特征具有冗余性,各自检测出的正负样本包含对方漏检和误检的图像.由于样本数的增加,再次训练所得到的新分类器的鲁棒性得到了很大提高,能更加准确地检测出车辆,而且由算法对未标记样本进行分类标记,不再需要人为标记,提高了车辆检测算法的自适应能力.  相似文献   

3.
基于有监督的虚假评论检测方法受限于标注语料的规模,为了更好地利用未标注评论数据来提高分类器的正确率和泛化能力,本文提出一种基于半监督主动学习的虚假评论检测方法.首先,定义并提取评论内容特征以及评论者行为特征,结合这两类特征来对虚假评论进行检测.然后,采用基于熵的主动学习算法选择对学习最有帮助的评论样本,获得其类别标注,将其合并到基于Tri-training的半监督学习算法的训练集中,利用大量未标注评论数据进行学习,提升分类器性能.最后,在领域评论数据集上进行实验,结果表明,将半监督学习与主动学习相结合,能够更有效的利用未标注评论数据,从而有效地提高虚假评论检测的效果.  相似文献   

4.
AdaBoost算法的推广——一组集成学习算法   总被引:2,自引:0,他引:2  
针对AdaBoost算法只适合于不稳定学习算法这一不足,基于增加新分类器总是希望降低集成分类器训练错误率这一思想,提出了利用样本权值来调整样本类中心的方法,使AdaBoost算法可以与一些稳定的学习算法结合成新的集成学习算法,如动态调整样本属性中心的集成学习算法、基于加权距离度量分类的集成学习算法和动态组合样本属性的集成学习算法,大大拓展了AdaBoost算法适用范围。针对AdaBoost算法的组合系数和样本权值调整策略是间接实现降低训练错误率目标,提出了直接面向目标的集成学习算法。在UCI数据上的实验与分析表明,提出的AdaBoost推广算法不仅有效,而且部分算法比AdaBoost算法效果更好。  相似文献   

5.
为改善大多数异常检测算法仅通过正常样本训练模型,缺乏异常样本,将会造成一定程度的误判问题,提出了一种基于有效异常样本构造的异常检测算法。通过K-means聚类算法得到代表不同类型正常事件的聚类簇,然后,基于异常事件的时序关系构造异常样本,再结合本文构造的异常样本,利用二分类支持向量机算法训练分类器,将检测任务转化为分类任务,从而提高检测准确率。本文在经典数据集(Avenue数据集)上进行了算法有效性验证,发现本文算法的检测准确度优于一些领域内的先进算法。因此,充分利用视频的时序关系进行异常样本的构造能有效提高异常检测的有效性。  相似文献   

6.
针对目前乳腺X线影像微钙化点感兴趣区域的提取方法复杂,效果不理想,保留微钙化区域的能力及排除非病变区域的能力差等方面的问题.依据微钙化点区域和非微钙化点区域的特征差异,提出了利用支持向量机来对乳腺组织子块是否是微钙化点区域进行分类,引入微钙化点的检测方法,利用形态学对含微钙化点的可疑区域进行检测,最后判断微钙化点簇,完成提取.实验证明,该方法操作简单,检出率较高,且假阳性得到明显降低,可大幅提高后期辅助诊断的效率.  相似文献   

7.
基于支持向量机和多球体的一对多分类器   总被引:1,自引:0,他引:1  
为了提高支持向量机(SVM)多分类器的训练效率,将多球体思想引入有指导学习,对训练样本按类别分别进行一类支持向量机(1-SVM)训练得到多球体分类器.针对多球体的冗余区域,构造简化一对多分类器将各球内混叠样本与正常样本分离.以上两个分类器性能互补,可以加权组合为多球体一对多分类器.同时给出了组合分类器基于交叉验证的权重估计和参数调整.仿真实验表明,相对于一对多算法,该分类器训练时间较短且分类正确率较高;相对于一对一算法,该分类器决策速度较快,有助于解决大样本的多分类问题.  相似文献   

8.
针对图像的低级特征表示与高级概念之间的语义鸿沟,本文利用密度聚类获得的簇分布信息和多示例学习框架在区分歧义性对象上的特点,提出了一个基于区域特征密度聚类和多示例学习的图像分类方法(DCRF-MIL)。该方法首先将每个图像分割为多个区域,将所有区域组成一个集合,在这个区域集合上,使用密度聚类算法学习到区域特征的簇分布信息;然后,将图像看作包,区域看作包中的示例,基于区域特征的簇分布信息,将包映射为簇分布空间上的一个向量作为包的特征,使得包特征带有图像区域的语义信息;最后,使用支持向量机算法,在带有包特征的训练集上训练分类器,对测试图像进行分类。在Corel图像集和MUSK分子活性预测数据集上的实验表明,DCRF-MIL算法具有分类精度高和参数易于选择等特点。  相似文献   

9.
针对高光谱数据维数高、有标签样本少等特点,采用半监督分类利用未标记样本信息提高高光谱图像分类精度。主动学习研究训练样本的选择方法,以少量的标记样本得到尽可能好的泛化能力。本文提出了一种结合主动学习算法的半监督分类算法。该方法使用支持向量机作为基本的学习模型,通过主动学习方法选取训练样本,以伪标记的形式加入到分类器的训练中,结合验证分类器迭代选出置信度较高的伪标记样本,通过差分进化算法交叉变异伪标记样本扩充标记样本群。在两个数据集上进行仿真实验,与传统分类算法相比,所提算法的总体分类精度分别提高了1.97%、0.49%,表明该算法能够有效地提升主动学习样本选择的效率,在有限带标记样本情况下提高了分类器精度。  相似文献   

10.
面向目标的带先验概率的AdaBoost算法   总被引:2,自引:1,他引:1  
针对集成学习算法研究中多个分类器的最佳组合问题,改进了传统的AdaBoost集成学习算法.用于组合的各个分类器通常是基于样本集通过一定的训练得到,样本集中不同类目标的比率可以反映分类目标的先验概率.使用该参数给出了新的组合参数和投票表决阈值计算公式,巧妙的利用样本权值并将其加入到样本属性上进行训练学习,采用新的策略来选择基分类器,给出了面向目标的带先验概率的AdaBoost算法(GWPP AdaBoost算法)和分类器的最佳组合.依据UCI实验数据对传统的AdaBoost算法、Bagging算法、GWPP AdaBoost算法的错误率和性能进行了比较分析,验证了GWPP AdaBoost的有效性.  相似文献   

11.
使用遗传算法的乳腺微钙化点特征优化   总被引:1,自引:0,他引:1  
乳腺微钙化点包含众多属性,由于其中存在的冗余和不相关属性降低了微钙化点病变类型判别的性能。因此,特征子集选择问题成为微钙化点病变类型识别中的重要问题。该文针对传统优化方法用于特征选择的种种缺陷,提出了基于遗传算法的特征子集选择测算法。经乳腺微钙化点特征选择实例分析,证明该方法拥有较强的并行性和寻优能力,在特征选择领域有广阔的应用前景。  相似文献   

12.
为了增强集成系统中各分类器之间的差异性,提出了一种使用旋转森林策略集成两种不同模型分类器的方法,即异构多分类器集成学习算法.首先采用旋转森林对原始样本集进行变换划分,获得新的样本集;然后通过特定比例选择分类精度高的支撑矢量机或分类速度较快的核匹配追踪作为基本的集成个体分类器,并对新样本集进行分类,获得其预测标记;最后结合两种模型下的预测标记.该算法通过结合两种不同分类器模型,实现了精度和速度互补,将二者混合集成后改善了集成系统泛化误差,相比单个模型集成提高了系统分类性能.对UCI数据集和遥感图像数据集的仿真实验结果表明,文中算法相比单一分类器集成缩短了运行时间,同时提高了系统的分类准确率.  相似文献   

13.
基于支持向量机的电力系统暂态稳定分类研究   总被引:6,自引:2,他引:4  
研究了支持向量机在电力系统暂态稳定评估中的应用,设计了一个新的支持向量机分类器用于暂态稳定分类。基于支持向量机分类器的输出,把样本划分为 3 类:稳定类,不稳定类和边界区样本,减少了误分类,提高了暂态稳定评估结果的可靠性。在新英格兰 10 机 39 节点系统中的仿真结果验证了该分类器的分类效果。同时,将分类结果与传统 BP 算法的结果进行了比较,对模型参数对输出结果的影响和本方法的适用范围进行了分析。  相似文献   

14.
为了构建一个具有良好的学习性能和推广能力的异常检测分类器,在结构风险最小(SRM)原则下讨论了基于支持向量机(SVM)的异常检测分类器的设计准则,提出了SVM分类器模型及其参数快速选择和评估方法,并给出了异常检测分类器训练步骤.针对KDD'99网络入侵检测数据集,实验结果表明,该方法能够有效地缩短入侵检测分类模型建立时...  相似文献   

15.
提出了一种基于遗传算法的受限制BAN分类器算法-GBAN(genetic algorithm based BAN)。新算法采用了遗传算法进行网络结构的学习,限制了所学习的BAN分类器结构的复杂度。同时对TAN分类器的结构进行了扩展,得到了一种受限制的BAN分类器。针对这种分类器的结构学习,设计了结合对数似然的适应度函数及相应的遗传算子,并给出了网络结构的编码方案,使得该算法能够收敛到全局最优的结构。实验结果表明,当数据集属性之间关系相对复杂的时候,GBAN比TAN的分类准确率高,分类效果较好。  相似文献   

16.
基于选择性集成分类器的通用隐写分析   总被引:2,自引:0,他引:2  
面对高维度的特征集和大规模的样本集,隐写分析技术对分类器的要求越来越高.在集成分类器的基础上提出了一种面向通用隐写分析的选择性集成分类器.首先基于随机森林生成若干个基分类器,然后利用基于遗传算法的选择性集成算法剔除掉个别影响整体性能的基分类器,最后根据遗传优化得到的最优权值向量赋予剩余的基分类器不同权值以用来加权投票集成.实验表明,提出的选择性集成分类器测试性能优于现有分类器,特别在基分类器数量较大、特征维数较高时与现有集成分类器相比,有效降低了检测错误率.  相似文献   

17.
为了避免由于乳腺中的致密组织与肿块类似的特征表现而造成的肿块检测精度不高,设计了基于典型特征的支持向量机分类器对提取出的感兴趣区域进行分类,并引入了相关反馈算法以进一步提高分类器的性能,提出了一种新的基于支持向量机和相关反馈技术的乳腺图像中肿块的检测方案.通过对大量乳腺图像的仿真实验显示,基于典型特征的支持向量机分类器能够将无特征支持向量机分类器的检出率提高约5%,而相关反馈技术的引入则使系统的检出率进一步提高到约90%.  相似文献   

18.
在多标签新闻分类问题中,针对传统分类器链算法难以确定标签依赖顺序、集成模型运行效率低和无法应用复杂模型作为基分类器的问题,提出基于深度神经网络的双向分类器链算法. 该方法利用正向分类器链获取每个标签和前面所有标签的依赖关系,引入逆向分类器链,从正向链最后一个基分类器的输出开始反向学习每个标签和所有其他标签的相关性. 为了提取非线性标签相关性和提高预测性能,使用深度神经网络作为基分类器. 结合2条分类器链的均方误差,使用随机梯度下降算法对目标函数进行有效优化. 在多标签新闻分类数据集RCV1-v2上,将所提算法与当前主流的分类器链算法和其他多标签分类算法进行对比和分析. 实验结果表明,利用深度双向分类器链算法能够有效提升预测性能.  相似文献   

19.
一种树形结构的实时道路车辆识别方法   总被引:1,自引:0,他引:1  
针对实时道路车辆识别是车辆计算机辅助驾驶、自主导航以及主动安全的关键技术,给出了一种基于树形结构的车辆识别方法。该方法采用Haar—like特征来表达车辆特征,选择GentleAda Boost算法训练出强分类器,最后将多个强分类器组合成树形结构。通过建立样本库,对车辆识别分类器进行了训练,并对分类器的性能进行了实验。结果表明:对750个目标车辆进行识别,识别率为74.4%,识别时间为34.4ms。说明树形结构的车辆识别方法具有较好的实时性和一定的鲁棒性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号