共查询到20条相似文献,搜索用时 15 毫秒
1.
在开放式网络中,高维混合特征的冗余或不相容属性会降低网络入侵检测的效率.为提高入侵检测系统的响应性能,提出一种混合特征选择方法,利用粗糙集形式化描述入侵检测的特征选择,采用信息熵和平均权重分别定义数值型和字符型特征的重要度.算法产生降序特征序列,采用K-means聚类算法评估出优化特征子集.在KDD CUP99数据集上的仿真实验表明,算法有效选择特征子集并缩短了检测时间. 相似文献
2.
将Filter型粗糙集属性约简方法与PSO‐SVM方法相结合,提出一种新的粗糙集粒子群支持向量机(RS‐PSO‐SVM )特征选择方法。给出了该方法的特征选择具体步骤,并对比分析了所提方法的性能。仿真实验表明:提出的RS‐PSO‐SVM特征选择方法是有效的,在保证所选特征集为最优情况下,极大地缩短所用时间,可以将其应用在多维数据的特征选择中。 相似文献
3.
A Knowledge Reduction Algorithm Based on Conditional Entropy 总被引:1,自引:1,他引:0
1 IntroductionSomeindustries ,includingtelecommunicationsandcreditcards ,haveinteractiverelationshipwithcustomersthatgeneratemanytransactionrecords,whichmakesdatatobegeneratedandcollectedatanunprecedentedspeed .However,thesedatahavetobeturnedintoknowledg… 相似文献
4.
5.
互信息是一种常用的特征选择评价函数,但研究表明它会导致分类精度相对较低.文中针对互信息倾向选择低频词的不足,提出了一种新的特征评价函数TFMIIE,将信息熵和改进互信息相结合,其中改进互信息能够避免偏向低频的生僻词,而特征熵有利于去除类别不确定的特征词.实验结果表明,采用TFMIIE进行特征选择,用得到的特征子集表示文本和构建分类器,文本分类的准确率与召回率比采用互信息的方法提高了约40%,验证了所提出的基于改进互信息和信息熵的文本特征选择方法是有效的. 相似文献
6.
7.
Saeid Asgari Taghanaki Mohammad Reza Ansari Behzad Zamani Dehkordi Sayed Ali Mousavi 《ETRI Journal》2012,34(6):847-857
Intrusion detection systems (IDSs) have an important effect on system defense and security. Recently, most IDS methods have used transformed features, selected features, or original features. Both feature transformation and feature selection have their advantages. Neighborhood component analysis feature transformation and genetic feature selection (NCAGAFS) is proposed in this research. NCAGAFS is based on soft computing and data mining and uses the advantages of both transformation and selection. This method transforms features via neighborhood component analysis and chooses the best features with a classifier based on a genetic feature selection method. This novel approach is verified using the KDD Cup99 dataset, demonstrating higher performances than other well‐known methods under various classifiers have demonstrated. 相似文献
8.
歌曲风格的自动分类技术研究,是音乐信息检索领域中一个重要课题.本文主要讨论了对中国民歌地域风格自动分类中不同特征选择方法对于分类性能的影响.论文选用10个不同地域的1392首原生态中国民歌,进行了地域风格的分类实验.实验结果表明:在多种分类器的试验中,SVM分类器的分类准确率最高;在多种特征选择实验中使用SVM与Active Feature Selection的特征选择方法的分类准确率最高,为83%,且选择出的有效特征参数从74维降为35维,更便于进行参数分析. 相似文献
9.
ReliefF是一种在很多场合经常使用的filter式的特征选择方法.然而该方法的一大缺点是不能辨别冗余特征。基于ReliefF算法提出一种混合的有监督的特征选择算法。该算法首先利用ReliefF算法去除与分类无关的以及权重低于一定阈值的特征,然后采用一种变量相似性准则来去除冗余特征。在实际的数据集KDDCUP'99上进行的实验结果表明该混合特征选择方法较单独使用ReliefF方法在分类精度上有一定的提高。 相似文献
10.
11.
12.
13.
网格计算的资源管理涉及到大量的互联网资源,为了有效管理与应用系统资源,需要研究相应的资源管理模型。基于此探讨了粗糙集理论的相关算法,在此基础上提出了一个粗糙集理论与数据挖掘问题相结合的应用模型。在研究中对该模型进行了模拟数据实验测试,结果与算法的理论结果一致,为粗糙集理论在网格计算领域的应用做了一些力所能及的尝试。 相似文献
14.
量子GA-PLS特征选择算法及其应用 总被引:1,自引:0,他引:1
为进一步提高遗传算法-偏最小二乘法的计算速度和计算效率,将量子算法融合到遗传算法-偏最小二乘法中,提出一种新的特征选择方法—量子遗传算法-偏最小二乘法(Quantum Genetic Algorithm-Partial Square Least,QGA-PLS)算法。该方法利用量子态和叠加态原理对染色体进行编码,采用量子旋转门进行遗传操作,以实现参数的更新和增强种群多样性,同时,用量子计算重新构建了偏最小二乘法回归模型来计算个体适应度,以充分发挥快速收敛和全局优化能力。将方法应用于函数极值优化和Iris数据集的特征选择,实验结果表明,QGA-PLS在特征选择、运算时间和分类准确率方面优于QGA和GA-PLS,从而验证了QGA-PLS算法的有效性。 相似文献
15.
《电子学报:英文版》2017,(6):1168-1176
As the conventional feature selection algorithms are prone to the poor running efficiency in largescale datasets with interacting features, this paper aims at proposing a novel rough feature selection algorithm whose innovation centers on the layered co-evolutionary strategy with neighborhood radius hierarchy. This hierarchy can adapt the rough feature scales among different layers as well as produce the reasonable decompositions through exploiting any correlation and interdependency among feature subsets. Both neighborhood interaction within layer and neighborhood cascade between layers are adopted to implement the interactive optimization of neighborhood radius matrix, so that both the optimal rough feature selection subsets and their global optimal set are obtained efficiently. Our experimental results substantiate the proposed algorithm can achieve better effectiveness, accuracy and applicability than some traditional feature selection algorithms. 相似文献
16.
属性约简是粗糙集理论的重要研究内容,已有效应用于机器学习、数据挖掘等领域.基于条件信息熵的属性约简可有效推广代数观下的属性约简,但存在抗噪声弱且某些情况下冗余属性多的不足.为此,本文在引入决策表中基于条件信息熵的近似约简概念后,提出决策表中基于条件信息熵的近似约简算法,该算法可有效增强抗噪性,且可依据实际应用的需要有效地对冗余属性进行取舍.最后,本文侧重通过选择不同精度下的约简属性子集在Benchmark上进行了分类器的性能测试. 相似文献
17.
18.
Feature selection is one of the challenging problems facing data analysis in areas such as pattern recognition, data mining, and decision support. Many rough set algorithms for feature selection have been developed, most of which are essentially dependent on the definite information contained within the lower approximation. This paper proposes a novel approach, called Unbal- anced binary tree based feature selection (UBT-FS), which utilizes the indefinite information contained within rough set boundary region for reduction. UBT-FS designs the underlying mechanism for obtaining the boundary region from the unbalanced binary tree and adopts the boundary region based significance for determining the optimal search path as well as the boundary region based evaluation criterion for identifying feature subsets. These allow UBT-FS to have considerable ability in finding an optimal or suboptimal reduct whilst simultaneously achieving obviously better computational efficiency than other available algorithms, which is also supported by the experimental results. 相似文献
19.
论文提出了一种基于优先级的入侵特征提取方法,在特征提取前,首先计算各个特征的优先级,然后选择优先级符合条件的特征进行提取,并且只处理这些特征所对应的数据包。理论分析和实验结果表明,与传统的特征提取方法相比,论文提出的方法能够节约CPU的处理时间。 相似文献
20.
数据挖掘技术及其在经营分析系统中的应用 总被引:3,自引:0,他引:3
为了在市场竞争中保持及发展客户、提升客户价值,运营商迫切需要了解客户的行为特征以及业务发展、收益、营销、服务等方面的运营情况,以便及时制定更加合理和高效的经营策略,更好地在竞争中掌握主动.于是,电信企业纷纷着手建立数据仓库和在线分析处理(OLAP)系统,通过对运营支撑系统多年积累的业务数据进行整合和分析,以获得有价值的分析结果.但是,OLAP侧重的是对历史数据的分析,回答的是"过去发生了什么和为什么会发生"的问题,而运营商在对过去和现在的经营状况进行分析掌握的同时,更加渴望对整个企业未来的发展状况做出比较完整、合理、准确的分析和预测,于是,数据挖掘技术由于能够发现潜在的知识以及能够回答"将要发生什么"的问题而被电信企业加以"重用".本文简要阐述了数据挖掘技术、主要模型及方法、数据挖掘的实施步骤,并结合具体的案例说明数据挖掘在电信行业经营分析系统中的应用. 相似文献