首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
在开放式网络中,高维混合特征的冗余或不相容属性会降低网络入侵检测的效率.为提高入侵检测系统的响应性能,提出一种混合特征选择方法,利用粗糙集形式化描述入侵检测的特征选择,采用信息熵和平均权重分别定义数值型和字符型特征的重要度.算法产生降序特征序列,采用K-means聚类算法评估出优化特征子集.在KDD CUP99数据集上的仿真实验表明,算法有效选择特征子集并缩短了检测时间.  相似文献   

2.
将Filter型粗糙集属性约简方法与PSO‐SVM方法相结合,提出一种新的粗糙集粒子群支持向量机(RS‐PSO‐SVM )特征选择方法。给出了该方法的特征选择具体步骤,并对比分析了所提方法的性能。仿真实验表明:提出的RS‐PSO‐SVM特征选择方法是有效的,在保证所选特征集为最优情况下,极大地缩短所用时间,可以将其应用在多维数据的特征选择中。  相似文献   

3.
A Knowledge Reduction Algorithm Based on Conditional Entropy   总被引:1,自引:1,他引:0  
1 IntroductionSomeindustries ,includingtelecommunicationsandcreditcards ,haveinteractiverelationshipwithcustomersthatgeneratemanytransactionrecords,whichmakesdatatobegeneratedandcollectedatanunprecedentedspeed .However,thesedatahavetobeturnedintoknowledg…  相似文献   

4.
分析了数据融合系统的内在特点,建立了数据融合系统性能评估的综合评估指标体系,提出了一种基于粗糙集和修正熵权的多层次综合评估模型。采用粗糙集理论对指标数据进行属性约减,消除冗余指标,计算属性权重,并对二级指标熵权进行修正;利用层次分析法计算主观权重对一级指标熵权进行修正。实例验证表明,该方法有效可行,提高了评估结果的客观性与可信性,为数据融合系统的开发、论证和实际使用提供了科学的理论决策依据。  相似文献   

5.
互信息是一种常用的特征选择评价函数,但研究表明它会导致分类精度相对较低.文中针对互信息倾向选择低频词的不足,提出了一种新的特征评价函数TFMIIE,将信息熵和改进互信息相结合,其中改进互信息能够避免偏向低频的生僻词,而特征熵有利于去除类别不确定的特征词.实验结果表明,采用TFMIIE进行特征选择,用得到的特征子集表示文本和构建分类器,文本分类的准确率与召回率比采用互信息的方法提高了约40%,验证了所提出的基于改进互信息和信息熵的文本特征选择方法是有效的.  相似文献   

6.
为了提高不平衡数据集分类中少数类的分类精度,提出了基于特征选择的过抽样算法.该算法考虑了不同的特征列对分类性能的不同作用,首先对训练集进行特征选择,选出一组特征列,然后根据选出的特征列合成少数类样本,合成的每个少数类样本的特征由两部分组成,一部分是特征选择的特征列对应的特征,另一部分是按照SMOTE原理合成的特征.将基于特征选择的过抽样算法和SMOTE算法进行实验比较,结果表明基于特征选择的过抽样算法的性能优于SMOTE算法,能有效降低数据的不平衡性,提高少数类的分类精度.  相似文献   

7.
Intrusion detection systems (IDSs) have an important effect on system defense and security. Recently, most IDS methods have used transformed features, selected features, or original features. Both feature transformation and feature selection have their advantages. Neighborhood component analysis feature transformation and genetic feature selection (NCAGAFS) is proposed in this research. NCAGAFS is based on soft computing and data mining and uses the advantages of both transformation and selection. This method transforms features via neighborhood component analysis and chooses the best features with a classifier based on a genetic feature selection method. This novel approach is verified using the KDD Cup99 dataset, demonstrating higher performances than other well‐known methods under various classifiers have demonstrated.  相似文献   

8.
刘怡  蔚磊  刘子利  王鹏 《电子学报》2008,36(Z1):152-156
 歌曲风格的自动分类技术研究,是音乐信息检索领域中一个重要课题.本文主要讨论了对中国民歌地域风格自动分类中不同特征选择方法对于分类性能的影响.论文选用10个不同地域的1392首原生态中国民歌,进行了地域风格的分类实验.实验结果表明:在多种分类器的试验中,SVM分类器的分类准确率最高;在多种特征选择实验中使用SVM与Active Feature Selection的特征选择方法的分类准确率最高,为83%,且选择出的有效特征参数从74维降为35维,更便于进行参数分析.  相似文献   

9.
ReliefF是一种在很多场合经常使用的filter式的特征选择方法.然而该方法的一大缺点是不能辨别冗余特征。基于ReliefF算法提出一种混合的有监督的特征选择算法。该算法首先利用ReliefF算法去除与分类无关的以及权重低于一定阈值的特征,然后采用一种变量相似性准则来去除冗余特征。在实际的数据集KDDCUP'99上进行的实验结果表明该混合特征选择方法较单独使用ReliefF方法在分类精度上有一定的提高。  相似文献   

10.
基于聚类的特征选择方法   总被引:2,自引:2,他引:2       下载免费PDF全文
蒋盛益  郑琪  张倩生 《电子学报》2008,36(Z1):157-160
 本文提出了一种度量特征区分度的定义,进而提出一种基于聚类的特征选择方法CBFS.该方法时间复杂度与数据集的大小和特征个数成近似线性关系,适合于大规模数据集中的特征选择;该方法对数据类型没有限制,适用于混合类型数据.在UCI数据集上的实验结果表明,与文献中的方法相比,本文方法具有较好的性能,说明提出的特征选择方法是有效和实用的.  相似文献   

11.
提出了一种多源遥感影像集值特征选择(SVFS)与评价新方法.该方法根据训练样本在原始特征空间中的多维统计特性建立了关于其集值特征的目标信息系统,对于给定的集值特征间的二元关系,利用属性约简进行了特征选择并给出了相应的重要度评价算法.对多源遥感影像的融合分类实验表明,该方法是基于广义粗糙集的多源遥感影像特征选择与融合分类有效手段.  相似文献   

12.
提出了一种由粗集理论和D S证据理论结合的多传感器数据融合方法 ,并将其应用于目标识别中。在目标识别的数据融合中 ,利用粗集理论对大量的传感器数据进行处理 ,判断出冗余传感器 ,得到传感器的最简组合 ,从而简化特征数据。然后利用D S理论实现目标的分类 ,改进分类的效果。因此 ,将两种方法结合起来应用于数据融合技术中来进行目标识别 ,为解决传感器数据超载以及不完整传感器信息融合提供了一种方法 ,且提高了识别的速度和效果  相似文献   

13.
网格计算的资源管理涉及到大量的互联网资源,为了有效管理与应用系统资源,需要研究相应的资源管理模型。基于此探讨了粗糙集理论的相关算法,在此基础上提出了一个粗糙集理论与数据挖掘问题相结合的应用模型。在研究中对该模型进行了模拟数据实验测试,结果与算法的理论结果一致,为粗糙集理论在网格计算领域的应用做了一些力所能及的尝试。  相似文献   

14.
量子GA-PLS特征选择算法及其应用   总被引:1,自引:0,他引:1  
为进一步提高遗传算法-偏最小二乘法的计算速度和计算效率,将量子算法融合到遗传算法-偏最小二乘法中,提出一种新的特征选择方法—量子遗传算法-偏最小二乘法(Quantum Genetic Algorithm-Partial Square Least,QGA-PLS)算法。该方法利用量子态和叠加态原理对染色体进行编码,采用量子旋转门进行遗传操作,以实现参数的更新和增强种群多样性,同时,用量子计算重新构建了偏最小二乘法回归模型来计算个体适应度,以充分发挥快速收敛和全局优化能力。将方法应用于函数极值优化和Iris数据集的特征选择,实验结果表明,QGA-PLS在特征选择、运算时间和分类准确率方面优于QGA和GA-PLS,从而验证了QGA-PLS算法的有效性。  相似文献   

15.
《电子学报:英文版》2017,(6):1168-1176
As the conventional feature selection algorithms are prone to the poor running efficiency in largescale datasets with interacting features, this paper aims at proposing a novel rough feature selection algorithm whose innovation centers on the layered co-evolutionary strategy with neighborhood radius hierarchy. This hierarchy can adapt the rough feature scales among different layers as well as produce the reasonable decompositions through exploiting any correlation and interdependency among feature subsets. Both neighborhood interaction within layer and neighborhood cascade between layers are adopted to implement the interactive optimization of neighborhood radius matrix, so that both the optimal rough feature selection subsets and their global optimal set are obtained efficiently. Our experimental results substantiate the proposed algorithm can achieve better effectiveness, accuracy and applicability than some traditional feature selection algorithms.  相似文献   

16.
决策表中基于条件信息熵的近似约简   总被引:3,自引:1,他引:2       下载免费PDF全文
杨明 《电子学报》2007,35(11):2156-2160
属性约简是粗糙集理论的重要研究内容,已有效应用于机器学习、数据挖掘等领域.基于条件信息熵的属性约简可有效推广代数观下的属性约简,但存在抗噪声弱且某些情况下冗余属性多的不足.为此,本文在引入决策表中基于条件信息熵的近似约简概念后,提出决策表中基于条件信息熵的近似约简算法,该算法可有效增强抗噪性,且可依据实际应用的需要有效地对冗余属性进行取舍.最后,本文侧重通过选择不同精度下的约简属性子集在Benchmark上进行了分类器的性能测试.  相似文献   

17.
张昊  陶然  李志勇  蔡镇河 《电子学报》2009,37(7):1628-1632
 在入侵检测中应用特征选择能够在保持原有信息完整性的基础上,去除其中的冗余特征,有效地提高入侵检测系统的检测速度.本文提出了一种新的特征选择方法,即基于KNN算法及禁忌搜索算法的特征选择方法.实验结果表明该特征选择方法能够有效去除网络数据信息中的冗余特征,减少特征选择时间;并且能够在保证检测准确率的前提下,有效提高系统的检测速度.  相似文献   

18.
Feature selection is one of the challenging problems facing data analysis in areas such as pattern recognition, data mining, and decision support. Many rough set algorithms for feature selection have been developed, most of which are essentially dependent on the definite information contained within the lower approximation. This paper proposes a novel approach, called Unbal- anced binary tree based feature selection (UBT-FS), which utilizes the indefinite information contained within rough set boundary region for reduction. UBT-FS designs the underlying mechanism for obtaining the boundary region from the unbalanced binary tree and adopts the boundary region based significance for determining the optimal search path as well as the boundary region based evaluation criterion for identifying feature subsets. These allow UBT-FS to have considerable ability in finding an optimal or suboptimal reduct whilst simultaneously achieving obviously better computational efficiency than other available algorithms, which is also supported by the experimental results.  相似文献   

19.
论文提出了一种基于优先级的入侵特征提取方法,在特征提取前,首先计算各个特征的优先级,然后选择优先级符合条件的特征进行提取,并且只处理这些特征所对应的数据包。理论分析和实验结果表明,与传统的特征提取方法相比,论文提出的方法能够节约CPU的处理时间。  相似文献   

20.
数据挖掘技术及其在经营分析系统中的应用   总被引:3,自引:0,他引:3  
蔡强  薛森 《电信科学》2005,21(1):56-62
为了在市场竞争中保持及发展客户、提升客户价值,运营商迫切需要了解客户的行为特征以及业务发展、收益、营销、服务等方面的运营情况,以便及时制定更加合理和高效的经营策略,更好地在竞争中掌握主动.于是,电信企业纷纷着手建立数据仓库和在线分析处理(OLAP)系统,通过对运营支撑系统多年积累的业务数据进行整合和分析,以获得有价值的分析结果.但是,OLAP侧重的是对历史数据的分析,回答的是"过去发生了什么和为什么会发生"的问题,而运营商在对过去和现在的经营状况进行分析掌握的同时,更加渴望对整个企业未来的发展状况做出比较完整、合理、准确的分析和预测,于是,数据挖掘技术由于能够发现潜在的知识以及能够回答"将要发生什么"的问题而被电信企业加以"重用".本文简要阐述了数据挖掘技术、主要模型及方法、数据挖掘的实施步骤,并结合具体的案例说明数据挖掘在电信行业经营分析系统中的应用.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号