首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 466 毫秒
1.
随着高速网络链路中数据量的剧增,以及越来越多的流行应用使用动态端口或使用加密流量通信,导致传统的网络流量分类方法失效.本文研究了应用层流量中存在的链路同质性,结合统计关联学习方法和流量传播图挖掘方法,提出了一种基于链路同质性的应用层流量分类方法.我们分析数据集中邻接链路之间的统计依赖关系并应用于网络协议识别,而不依赖于数据包载荷与网络流特征.实验结果表明,本文提出的方法能够实现超过80%的流量识别精度.  相似文献   

2.
针对当前基于流特征的流量识别方法准确率较低的问题,提出一种基于互信息的P2P流量特征选择方法和基于该方法的随机森林技术在流量识别中的应用模型,将网络流数据流分为P2P流和非P2P流。实验证明,该方法具有较高的识别率,说明了采用随机森林技术进行P2P流量识别的有效性。  相似文献   

3.
僵尸网络利用诸如蠕虫、木马以及rootkit等传统恶意程序,进行分布式拒绝服务攻击、发送钓鱼链接、提供恶意服务,已经成为网络安全的主要威胁之一。由于P2P僵尸网络的典型特征是去中心化和分布式,相对于IRC、HTTP等类型的僵尸网络具有更大的检测难度。为了解决这一问题,该文提出了一个具有两阶段的流量分类方法来检测P2P僵尸网络。首先,根据知名端口、DNS查询、流计数和端口判断来过滤网络流量中的非P2P流量;其次基于数据流特征和流相似性来提取会话特征;最后使用基于决策树模型的随机森林算法来检测P2P僵尸网络。使用UNB ISCX僵尸网络数据集对该方法进行验证,实验结果表明,该两阶段检测方法比传统P2P僵尸网络检测方法具有更高的准确率。  相似文献   

4.
针对采用云流量混淆Meek机制的Tor匿名通信流量与其他普通云流量难于区分识别的问题,提出了基于流静态特征的Tor匿名通信识别方法和基于支持向量机SVM分类算法的Tor匿名通信识别方法。本文首先从连接特征分析、数据包静态特征分析以及数据流动态特征分析出发,通过对大量Tor-Meek通信流量以及非Tor-Meek通信流量的对比实验研究,确定了7个具有特异性和较强区分度的Tor-Meek通信流量的静态和动态流量征,然后在此基础之上提出了基于特征匹配算法的Tor-Meek匿名通信识别方法,该方法能够快速识别Tor-Meek通信流量,对于包含大于200个包的流识别准确率大于90%。为了进一步适应Tor的版本变化带来的特征改变,基于Meek流分片机制的数据流统计特征分析,分别从长度及个数、长度方差、长度熵、接收发送序列等4个方面,提出了识别Tor-Meek流的16种Tor-Meek流量统计特征,采用SVM分类算法对Tor-Meek流量进行识别,通过系统的实验研究不同特征组合、不同算法参数选择的算法识别准确率和召回率,筛选出最优的特征组合和参数。在实验室环境中搭建实验数据采集平台并采集Tor-Meek通信和其他通信数据进行实验,该算法对长度大于40个包Tor-Meek流的识别准确率大于97%,召回率大于99%,且具有较高的识别效率。实验结果表明,采用特征匹配可以实现对云流量混淆Tor匿名通信的快速识别,而基于流分片统计特征的分类算法对不同Tor通信软件版本的变化具有更高的稳定性和识别准确率。  相似文献   

5.
针对基于特征向量的实体关系抽取方法中分类算法分类精度的不足,提出了基于集成学习算法的实体关系抽取方法.该方法将实体特征组合并转化为特征向量,使用集成学习中的ADABoost.MH算法来构造实体关系抽取的分类器,弱分类器采用决策树进行构造,通过提高分类效果好的分类器的权重和分类错误样本权重的方式来提高分类的精度,从而实现实体关系类别的识别.该方法在对《人民日报》语料库的测试中,得到了比较好的效果.  相似文献   

6.
针对网络流量在线识别的难题,提出一种聚类算法和在线流量识别方案.以网络数据流的若干初始数据包作为子流,提取子流的统计特征,应用基于滤波器算法的属性相关性算法提取子流最佳特征子集,并提出基于密度的在线带噪声空间聚类算法对子流特征向量进行聚类,采用优势概率业务实现聚类和应用类型的映射.实验结果表明,该方案具备识别新应用类型和加密数据流的功能,且能实现在线的网络流量分类.  相似文献   

7.
针对基于决策树的数字调制识别方法在低信噪比和小样本情况下的不足,提出了一种改进的基于特征选择和支持向量机的数字调制识别算法。首先选择信号训练样本的循环谱截面作为备选特征集合,然后利用基于支持向量机的特征选择方法保留有效特征参数并训练分类器,最后将待识别信号选择后的特征输入支持向量机分类器,完成对ASK、MSK、PSK、QAM等4类信号的识别。仿真表明,本文算法在低信噪比和小样本情况下的识别性能优于基于决策树的调制识别方法。  相似文献   

8.
为提高基于表面肌电图(surface Electromyo Graphy, sEMG)手势识别的准确率,提出一种改进深度森林相结合的手部运动识别方法.将极致梯度提升(eXtreme Gradient Boosting,XGBoost)树引入深度森林模型,与随机森林和完全随机森林共同组成深度森林的级联结构.深度森林模型在每个层次上集成3种不同的基于树的分类器,共4个决策森林,包括1个随机森林、1个极端随机森林和2个极致梯度提升树,利用不同学习算法之间的互补性来提高分类性能.为评估该模型性能,采集4名健康受试者的表面肌电信号进行手部动作识别验证试验,并与随机森林、支持向量机、一维卷积神经网络及二维卷积神经网络等算法比较.结果表明,提出方法对16种常用手部动作的平均识别精度为94.14%,对表面肌电信号实现了较高的分类准确率.  相似文献   

9.
机器学习用于网络流量识别   总被引:6,自引:2,他引:4  
提出了将机器学习中的C4.5算法应用于传输层的网络流量特征识别技术.运用相关性特征选择和遗传算法形成了流量特征子集.提出并采用 N折交叉验证与测试集相结合的方法评估了国家运营宽带网络中的流量测试分类结果.实验证明,无需预知端口和协议标签,网络流量就能被成功地识别与分析.  相似文献   

10.
提出一种基于ReliefF算法的时频联合特征及随机森林的配电网电缆故障识别方法. 针对零序电压,从时域和频域构造23个故障敏感特征,采用ReliefF算法进行特征选择,得到最具分类能力的特征子集. 将特征子集作为基于随机森林的输入进行训练,得到最终的分类模型,实现了电缆故障类型识别. 所提方法与基于单一特征的方法相比,能够更加充分地挖据数据潜力,同时由于采用ReliefF算法筛除了无关特征,提高了算法效率. 最后采用Matlab软件进行仿真,并与决策树、KNN、SVM等算法进行比较,仿真结果验证了所提方法的可行性和高准确性.  相似文献   

11.
以太行山区为研究对象,基于Sentinel-2A遥感影像数据,采用基于像元和面向对象分类两种策略,定量分析不同特征组合模式下,最大似然法(ML)、贝叶斯(Bayes)、支持向量机(SVM)、决策树(Decision Tree)以及随机森林(RF) 5种分类方法在该区域地表土地覆被信息分类中的表现差异。结果表明:(1)基于像元的RF分类器取得了最高精度,仅使用光谱特征参与分类和使用光谱、红边、指数特征参与分类的总体精度分别为96. 85%和96. 64%。(2)红边和指数特征的加入能够对各分类器分类精度产生不同程度的影响,即使基于像元的RF和面向对象的CART决策树总体精度有所下降,但降幅均在0. 5%左右,其他分类器精度均有所提升。  相似文献   

12.
基于差分隐私下包外估计的随机森林算法   总被引:1,自引:0,他引:1  
针对差分隐私随机森林算法在对高维数据进行分类时准确率不理想的问题,本文通过引入差分隐私下的包外估计来计算决策树权重以及特征权重,从而提出一种基于差分隐私下包外估计的随机森林算法(random forest under differential privacy based on the out-of-bag estimate, RFDP_OOB).本算法首先在差分隐私保护下生成一部分的随机森林,利用差分隐私下包外估计的特性对决策树和特征的重要性进行评估,从而计算出决策树权重以及特征权重,然后通过特征权重对特征进行划分,得到非重要特征集.接着在生成剩下的一部分随机森林的过程中,对最佳特征为非重要特征的结点进行预剪枝操作,使其成为叶子结点,从而减小噪声、提高决策树分类准确率,并具有较好的执行效率.最后在预测分类结果时,取所对应的决策树权重最大的分类结果作为随机森林算法的分类结果,从而提高随机森林算法的分类准确率.本文还对算法的有效性和隐私性进行了理论分析,并通过实验结果验证了本算法的有效性,本算法可以在保护数据隐私性的同时提高算法的分类准确率.  相似文献   

13.
基于在线特征选择的网络流异常检测   总被引:1,自引:1,他引:0  
针对传统批处理特征选择方法处理大规模骨干网数据流存在时间和空间的限制,提出基于在线特征选择(online feature selection, OFS)的网络流异常检测方法,该方法将在线思想融入线性分类模型,在特征选择过程中,首先使用在线梯度下降法更新分类器,并将其限制在L1球内,然后用截断函数控制特征选择的数量。研究结果表明,提出的方法能充分利用网络流的时序性特点,同时减少检测时间且准确率和批处理方法相近,能满足网络流异常检测的实时性要求,为网络流分类和异常检测提供一种全新的思路。  相似文献   

14.
针对Netflow提供的流量信息有限的问题,在Netflow的基本信息基础上构建更丰富的特征空间,通过机器学方法(决策树、朴素Bayes方法和Bayes网络)研究了Netflow用于流量分类的可行性。实验结果表明,决策树方法在Netflow数据上具有良好的分类效果;同时结合Netflow的广泛性,提出的方法具有良好的实用意义和推广价值。  相似文献   

15.
介绍了神经网络分类器的基本原理,针对3类交通标志,即禁止标志、警告标志和指示标志,提出了应用神经网络分类器进行交通标志自动识别的基本方法。神经网络分类器由两层网络联结而成,前层网络由单个BP网络完成交通标志的粗分工作,后层由3个BP网络将粗分结果分别进行细分,完成识别任务。此设计结构与传统的单层分类器相比,在训练速度和识别正确率方面都有较大的提高;显然,这与神经网络在解决小规模问题时正确率高、训练速度快相符合。同时,增加新的训练样本时,只要对相应网络进行训练即可,而不必对整个网络进行重新训练。实验结果表明,基于神经网络的交通标志自动识别方法,具有很好的识别效果。  相似文献   

16.
为解决在计算机辅助诊断(computer aided diagnosis, CAD)中采用人工提取医学影像特征的弊端,在ImageNet数据集上预训练深度神经网络模型Alexnet,通过迁移学习再训练后的Alexnet模型对医学影像进行特征提取,利用集成学习方法训练分类器进行分类。试验结果表明,基于Alexnet和随机森林方法的分类器正确率达到了0.87±0.03,集成分类器的分类性能优于单一分类器。  相似文献   

17.
针对模式识别中的多分类器集成,通过挖掘测试样本特征属性的相关性,结合训练集的条件独立性分析对每个样本赋予分类规则,构造分类森林(而非单个决策树)进行模型集成。整个学习过程能够自适应确定各决策树结构和数量,并充分发挥集成模型的伸缩性和扩展性。在UCI机器学习数据集上的实验结果验证了本方法的有效性。  相似文献   

18.
一种基于本体的并行网络流量分类方法   总被引:1,自引:0,他引:1  
海量网络流量数据的处理与单一节点的计算能力瓶颈这一矛盾导致数据分类效率低,无法满足现实需求。为解决这一问题,结合本体与MapReduce技术各自在海量异构数据描述与处理方面的优势,提出一种基于本体的并行网络流量分类方法。该方法基于MapReduce并行计算架构,根据网络流量本体结构,对网络流量本体并行化构建;通过并行知识推理完成基于流量统计特征的网络流量分类。实验结果表明,集群环境下基于MapReduce的网络流量本体构建效率明显高于单机环境,而且适当增加计算节点使得加速比线性提升;并行知识推理的分类方法能够有效地提高大规模网络流量的分类效率。  相似文献   

19.
主要阐述了决策树学习算法在交通方式选择模型中的应用.在基本决策树的基础上,使用随机森林组合学习算法来建立交通方式选择模型,以Bagging预测方法和CART算法为主,以随机特征选择和"投票"方法为辅,并相互融合,结合具体实例详细介绍该模型的建立,从数据的选择到整个森林中树的数目和每个结点处抽取的候选属性的个数调整,并对模型进行了相应的评估.实验结果表明,随机森林预测精度高,且对噪声数据具有较强的稳健性,采用决策树学习算法得出的规则在交通方式选择的分析中具有较好的实用价值.  相似文献   

20.
为分析病理人群与正常人群的发音差异性,提出一种结合语音融合特征和随机森林的语音识别方法来进行正常语音与构音障碍语音的分类识别,从而为医学诊断和治疗提供科学和客观的依据.首先,使用多伦多大学开发的病理语音数据库,提取出语音的五种韵律特征以及梅尔频率倒谱系数,再计算其统计特征,构成融合特征,最后结合随机森林算法进行分类识别.结果显示,相比于单一类型特征,提出的融合特征在识别性能上有着显著优化作用,与随机森林分类器结合后,对于男性声音的分类准确率达到99.21%,对于女性声音的分类准确率达到98.97%,综合分类准确率达到98.00%.同时研究还发现,相较于句子,患者对短语的发音更为准确.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号