首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
为了提高入侵检测的准确率和效率,本文结合粗糙集属性约简理论,提出基于混合基因表达式编程的入侵检测算法(Intrusion Detection Based on Hybrid Gene Expression Programming,ID-HGEP)。仿真实验表明,针对复杂网络入侵数据集,与传统GEP算法相比,ID-HGEP算法的收敛速度提高了约1.2倍,入侵检测准确率提高了约12.04%,同时算法的平均耗时下降了约1.17倍。  相似文献   

2.
针对传统的方法未能有效地处理具有高维、混合以及不平衡的特性的入侵检测数据,结合单类分类概念和均值计算方法,提出一种单类分类K近邻(KNN)均值算法。其使用主成分分析混合(PCA mix)方法对高维混合数据进行降维预处理,并运用Bootstrap方法计算决策边界,提高准确性。通过使用三个不同的公开数据集进行实验,并与单类分类支持向量机(OCSVM)算法作对比,其分辨精度提高至94%以上,充分验证了提出算法的优越性。  相似文献   

3.
基于网络入侵检测的蜂群算法优化模式是一个用于网络入侵检测开发的专用编程接口。基于该编程接口,在Linux平台上设计和实现了一个复杂的入侵检测系统。基于网络入侵检测的蜂群算法与差分进化算法(DE)混合,采取数据信息处理模式,可以按照双群结构的要求,进行数据信息独立分析,从而能够产生数据信息交换功能。通过分布式技术对蜂群进行空间分析,通过空间信息搜索工具,保证学习策略功能能够完成。从仿真实验看提高种群解的质量。设计了一种简单入侵检测模式的描述语言,对入侵检测的特征数据库进行优化,对网络异常行为进行入侵检测。  相似文献   

4.
彭国星 《计算机仿真》2010,27(6):175-178
分布式关联规则算法应用于入侵检测的研究是重要研究问题.入侵数据每条记录不长但记录数目在短时间内累积量大,对全局频繁项目集更新算法的执行效率低.为提高效率,由于分布式入侵检测的全局频繁项目集更新算法不多,现提出一种关联规则快速更新算法(Trivial Distributed Update of Association rules,TDUA) .引入强频繁项目集概念,有效地修剪候选项目集数目,采用共享模式的体系结构进行仿真,结果表明挖掘效率高.实验结果表明,所提出的算法的可行性和有效性.  相似文献   

5.
陈蕾  邵楷  林腾涛  陈兴国 《自动化学报》2021,47(12):2801-2814
生存分析旨在预测某个感兴趣事件发生前的延续等待时间, 已广泛应用于临床治疗中患者的生存状态分析. 然而, 受限于研究代价高昂和环境因素的影响, 现有的生存分析方法不可避免地面临着高维小样本挑战以及复杂环境所引起的噪声敏感等问题. 为了克服上述缺陷, 本文提出一类噪声容错弱监督直推式矩阵补全(Weakly supervised transductive matrix completion, WSTMC)生存分析方法. 该方法首先将生存分析问题建模为多任务直推式矩阵补全模型, 然后引入高斯混合分布拟合真实数据中的复杂噪声以减轻模型的噪声敏感性, 同时设计了一类多任务直推式特征选择机制来缓解高维小样本所带来的过拟合缺陷. 此外, 设计了一类有效的拟期望最大化优化算法用于求解所提出的WSTMC模型. 最后, 5个微阵列基因表达数据集上的实验结果证实了所提出的WSTMC模型优于当前广泛使用的18种生存分析方法.  相似文献   

6.
针对软件定义网络(Software Defined Ntwork,SDN)中的分布式拒绝服务(Distribute Denial of Service,DDoS)攻击检测的方法少、现存方法入侵检测率低的问题,提出了一种基于深度学习和三支决策的入侵检测算法.首先使用深度信念网络对SDN的流表项进行特征提取,然后利用基于三支决策理论的入侵检测模型进行DDoS攻击的入侵检测,对于正域和负域的数据直接进行分类,对于边界域中的数据使用K近邻算法重新进行分类.仿真实验结果表明,与其他入侵检测模型相比,所提算法的入侵检测效率更高.  相似文献   

7.
基于Spark的蚁群优化算法   总被引:2,自引:0,他引:2  
为应对大数据时代中组合优化问题的求解,基于云计算框架Spark,借助其基于内存、分布式的特定,提出一种并行蚁群优化算法。其思路是通过将蚂蚁构造为弹性分布式数据集,由此给出相应的一系列转换算子,实现了蚂蚁构造解过程的并行化。通过在旅行商问题(TSP)求解的仿真实验结果说明了所提出的并行算法的可行性;并在同等实验环境下对比基于MapReduce的蚁群优化算法,优化速度提升达10倍以上。  相似文献   

8.
近年来,机器学习不断取得显著性进展并被成功应用于诸多领域,然而很多学习模型或算法高度依赖数据的标签质量。实际应用中大量数据集普遍存在复杂的标签噪声,因此机器学习在低质数据建模和标签噪声处理方面面临严峻挑战。文中针对回归中的数值型标签噪声,从理论分析和仿真实验的角度研究了标签估计区间与噪声的关联性,提出了一种极限距离噪声估计方法。在最优样本选择框架下,基于此噪声估计方法提出了一种极限距离噪声过滤(Limit Distance Noise Filtering, LDNF)算法。实验结果表明,所提噪声估计方法与真实标签噪声具有更高的相关性和更低的估计偏差。在标准数据集和真实年龄估计数据集上证实了所提过滤算法可以在不同噪声环境下有效识别标签噪声并减小模型的测试误差,其表现优于最新的其他过滤算法。  相似文献   

9.
牟琦  毕孝儒  厍向阳 《计算机工程》2011,37(14):103-105
高维网络数据中的无关属性和冗余属性容易使分类算法的网络入侵检测速度变慢、检测率降低。为此,提出一种基于遗传量子粒子群优化(GQPSO)算法的网络入侵特征选择方法,该方法将遗传算法中的选择变异策略与QPSO有机结合形成GQPSO算法,并以网络数据属性之间的归一化互信息量作为该算法适应度函数,指导其对网络数据的属性约简,实现网络入侵特征子集的优化选择。在KDDCUP1999数据集上进行仿真实验,结果表明,与QPSO算法、PSO算法相比,该方法能更有效地精简网络数据特征,提高分类算法的网络入侵检测速度及检测率。  相似文献   

10.
基因表达式编程(Gene Expression Programming, GEP)是一种计算量大且通用性强的新型进化算法,其传统计算形式不能充分利用目前主流的多核处理器。为提高算法效率,提出了基于通用多核处理器平台的并行基因表达式编程算法(Parallel Gene Expression Programming Based on General Multi-core Processor, PGEP-MP)。主要工作包括:O)分析通用多核处理器平台下并行基因表达式编程算法的机理;(2)利用MPI和()pcnMP混合编程模型设计基于通用多核处理器平台的基因表达式编程算法的粗粒度与细粒度相结合的并行模型;(3)提出改进PEEP-MP算法效率的进化策略;(4)通过对函数挖掘和分类的实验证明,PEEP-Ml〕算法提高了函数挖掘和分类的效率,在并行双核处理器数为4的情况下,PEEP-MP的平均并行加速比分别是传统GEP算法的4. 22倍和 4. 06倍。  相似文献   

11.
传统机器学习算法需要人工构建样本特征,处理海量多源异构网络入侵数据时分类效果较差。针对该问题,结合深度信念网络(DBN)和核极限学习机(KELM),提出一种混合深度学习入侵检测算法DBN-KELM。利用DBN提取高维网络历史数据的抽象特征,获得原始数据的低维表示形式。在此基础上,通过KELM对低维表示的数据做监督学习,达到准确识别网络攻击的目的。在NSL-KDD数据集上进行仿真,实验结果表明,DBN-KELM算法能够提高分类准确率,降低对小样本攻击的误报率,同时缩短分类器的训练时间。  相似文献   

12.
高维混合多目标优化问题因包含多个不同类型指标,目前尚缺乏有效求解该问题的进化优化方法。提出一种基于目标分组的高维混合多目标并行进化优化方法。采用深度学习神经网络预测种群隐式性能指标;基于指标相关性,将高维混合多目标优化问题分解为若干子优化问题;采用多种群并行进化算法,求解分解后的每一子优化问题,并基于各子种群的非被占优解构建外部保存集;采用聚合函数对外部保存集个体进一步优化,得到Pareto最优解集。在室内布局优化问题中验证所提方法,实验结果表明,所提方法的Pareto最优解在收敛性、分布性以及延展性等方面均优于对比方法。  相似文献   

13.
基于改进单类支持向量机的工业控制网络入侵检测方法   总被引:2,自引:0,他引:2  
针对单类支持向量机(OCSVM)入侵检测方法无法检测内部异常点和离群点导致决策函数偏离训练样本的问题,提出了一种结合具有噪声的密度聚类(DBSCAN)方法和K-means方法的OCSVM异常入侵检测算法。首先通过DBSCAN算法,剔除训练数据中的离群点,消除离群点的影响;然后利用K-means划分数据类簇的方法筛选出内部异常点;最后利用OCSVM算法为每一个类簇建立单分类器用于检测异常数据。工控网络数据集上的实验结果表明,该组合分类器能够利用无异常数据样本检测出工控网络入侵,并且提高了OCSVM方法的检测效果。在气体管道网络数据集入侵检测实验中,所提方法的总体检测率为91.81%;而原始OCSVM算法则为80.77%。  相似文献   

14.
针对传统机器学习方法在处理不平衡的海量高维数据时罕见攻击类检测率低的问题,提出了一种基于深度学习的随机森林算法的入侵检测模型,为了避免传统的随机森林面对高维数据和不平衡数据时分类精度低、稳定性差和对罕见攻击类检测率低的问题,引入生成式对抗网络(GAN)和栈式降噪自编码器(SDAE)对随机森林算法(RF)进行改进。将罕见攻击类数据集输入GAN神经网络中,生成新的攻击类样本,改善网络入侵数据在样本集中不均衡分布的情况,通过堆叠深层的SDAE逐层抽取网络数据的分布规则,并结合各个编码层的系数惩罚和重构误差,来确定高维数据中与入侵行为相关的特征,基于降维后的特征数据构建森林决策树。采用UNSW-NB15数据集的实验结果表明,与SVM、KNN、CNN、LSTM、DBN方法相比,GAN-SDAE-RF整体检测准确率平均提高了9.39%、误报率和漏报率平均降低了9%和15.24%以及在少数类Analysis、Shellcode、Backdoor、Worms上检测率分别提高了26.8%、27.98%、27.85%、39.97%。  相似文献   

15.
LASSO(Least Absolute Shrinkage and Selection Operator)是1范数和2范数混合学习的一种理论框架,基于LASSO提出了局部保持投影的稀疏回归算法SpLPP及其广义的正则化形式RSpLPP,并从理论上证明了所提模型的收敛性及求解算法,给出了算法的复杂性分析.所提算法同时具有特征选择、降维的特性,在有监督学习、无监督学习两种任务情况下,都可以应用该算法.在人工数据集和真实数据集上进行的大量仿真实验,取得了较好的结果,证明了所提算法的有效性.  相似文献   

16.
梯度提升树算法由于其高准确率和可解释性,被广泛地应用于分类、回归、排序等各类问题.随着数据规模的爆炸式增长,分布式梯度提升树算法成为研究热点.虽然目前已有一系列分布式梯度提升树算法的实现,但是它们在高维特征和多分类任务上性能较差,原因是它们采用的数据并行策略需要传输梯度直方图,而高维特征和多分类情况下梯度直方图的传输成为性能瓶颈.针对这个问题,研究更加适合高维特征和多分类的梯度提升树的并行策略,具有重要的意义和价值.首先比较了数据并行与特征并行策略,从理论上证明特征并行更加适合高维和多分类场景.根据理论分析的结果,提出了一种特征并行的分布式梯度提升树算法FP-GBDT.FP-GBDT设计了一种高效的分布式数据集转置算法,将原本按行切分的数据集转换为按列切分的数据表征;在建立梯度直方图时,FP-GBDT使用一种稀疏感知的方法来加快梯度直方图的建立;在分裂树节点时,FP-GBDT设计了一种比特图压缩的方法来传输数据样本的位置信息,从而减少通信开销.通过详尽的实验,对比了不同并行策略下分布式梯度提升树算法的性能,首先验证了FP-GBDT提出的多种优化方法的有效性;然后比较了FP-GBDT与XGBoost的性能,在多个数据集上验证了FP-GBDT在高维特征和多分类场景下的有效性,取得了最高6倍的性能提升.  相似文献   

17.
曹泽文  周姚 《计算机工程》2012,38(24):14-16
针对大规模文本聚类分析所面临的海量、高维、稀疏等难题,提出一种基于云计算的海量文本聚类解决方案。选择经典聚类算法Jarvis-Patrick(JP)作为案例,采用云计算平台的MapReduce编程模型对JP聚类算法进行并行化改造,利用搜狗实验室提供的语料库在 Hadoop平台上进行实验验证。实验结果表明,JP算法并行化改造可行,且相对于单节点环境,该算法在处理大规模文本数据时具有更好的时间性能。  相似文献   

18.
入侵检测技术在网络安全防卫体系中变得越来越重要.在实际应用中,为了提高检测率通常采用基于多点的分布式数据采集或基于多引擎的协作式入侵检测,但是伴随而来的是警报数量和误报数量的海量增加,使管理员无法分辨警报的真伪并有效地管理入侵检测系统,从而降低了入侵检测系统的有效性和可用性.提出了一种基于密度的抗噪声时间聚类算法,将警报聚合和关联分析方法运用于分布式多引擎入侵检测场合来解决上述问题.实验采用数据集测试的方法对算法和原型系统进行了测试,并和相关研究工作进行了比较和分析.实验结果表明,系统对于分布式扫描有良好的检测效果,并在检测的实时性能上表现出优势.  相似文献   

19.
基因表达式编程在软件可靠性建模中的应用   总被引:2,自引:0,他引:2  
基因表达式编程是一种基于遗传算法和遗传编程的新型机器学习技术,其具有更为优秀的数据挖掘能力,已被成功应用于函数发现领域。提出一种基于基因表达式编程的非参软件可靠性建模方法,该方法将基因表达式编程算法中的若干关键步骤(如初始种群函数集、适应度函数、终止条件等)与软件可靠性建模的若干重要特征相融合,在失效数据集上进行训练,从而获得基于基因表达式编程算法的非参软件可靠性模型。在若干组真实失效数据集上,将所提出的模型与若干典型的基于人工神经网络以及遗传编程的非参软件可靠性模型进行对比实例研究。实例结果表明,基因表达式编程算法的非参软件可靠性模型具有更为显著的模型拟合与预计性能。  相似文献   

20.
基于基因表达式编程的抗噪声数据的函数挖掘方法   总被引:29,自引:0,他引:29  
用传统基因表达式编程(GEP)适应度机制挖掘函数关系容易受到噪声干扰,导致结果失真.为此做了如下探索:①借鉴生物具有的“趋利避害”天性,提出了GEP的“弱适应模型”,以实现在含噪声的数据集上挖掘函数关系;②提出新概念“带内集”、“带外集”并用于划分训练数据集;③设计了在弱适应模型下基于相对误差计算适应度的算法REFA;④用详尽的实验验证了REFA的有效性,当测量数据的噪声率为3.33%时,与传统方法相比,REFA方法的成功率提高了3倍,产生结果的平均相对误差从7.899%降低到2.320%.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号