首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 109 毫秒
1.
针对基于内容的网络信息过滤中存在的特征维数过高影响分类过滤效果问题,运用遗传算法进行特征选择,通过遗传操作搜索最优解.并且引入个体寿命概念用于实施种群更新,同时根据种群进化情况动态调整遗传操作算子,从而解决遗传算法训练过程中种群以及操作算子的单一性带来局部最优问题.实践证明,该方法能够实现特征子集空间规模的压缩,有效提高过滤效果.  相似文献   

2.
现有图像分类大都采用单一特征,不能利用多个特征之间性能互补优势,且将特征选择与分类器构造分割开来,影响图像分类的精度和分类器的泛化能力。针对以上问题提出一种基于混沌二进制粒子群算法(CBPSO)的特征选择和SVM参数同步优化方法,利用图像的综合特征,将特征选择和SVM分类器构造结合同步优化,仿真实验结果表明,该算法能同步找出最优的特征子集和合适的SVM参数,提高了图像分类精度和分类器泛化能力。  相似文献   

3.
《信息技术》2019,(2):53-57
随着信息技术的飞速发展以及网民规模的扩大,互联网数据量与日俱增,其中含有大量非结构化文本数据,因此,文中分类已成为当前的研究热点。特征选择的好坏直接影响文本分类的精度。传统单一的特征选择方法侧重点不同,使用不同的特征选择方法选择后的特征子集可能差别较大,进而导致不稳定的分类结果。文中提出了一种混合CHI与IG的特征选择方法,引入了融合特征的指标SOM(Score of Mixed),将特征根据SOM值排序,通过预定的阈值进行特征筛选,得出相对稳定且具代表性的特征子集。实验结果表明,使用该方法进行特征选择,文本分类的效果相比使用其他特征选择方法有一定的提升。  相似文献   

4.
入侵检测中基于SVM的两级特征选择方法   总被引:2,自引:0,他引:2  
针对入侵检测中的特征优化选择问题,提出基于支持向量机的两级特征选择方法。该方法将基于检测率与误报率比值的特征评测值作为特征筛选的评价指标,先采用过滤模式中的Fisher分和信息增益分别过滤噪声和无关特征,降低特征维数;再基于筛选出来的交叉特征子集,采用封装模式中的序列后向搜索算法,结合支持向量机选取最优特征子集。仿真测试结果表明,采用该方法筛选出来的特征子集具有更好的分类性能,并有效降低了系统的建模时间和测试时间。  相似文献   

5.
为提高网络故障诊断系统的诊断精度,节约计算资源,针对需要处理的含有大量无关或冗余特征的数据,提出了一种基于杂交BPSO-SVM的网络故障特征选择算法.该算法采用封装器模式,以SVM的分类准确率和特征压缩比作为适应度函数来指导杂BPSO进行特征选择,将选择出的最优特征子集用于故障诊断.运用Kdd’99数据集的实验结果表明,杂交BPSO-SVM提高了诊断精度,降低了特征维数,可进一步提升网络故障诊断效果.  相似文献   

6.
基于目前肿瘤基因表达谱数据在医学相关结合行业的广泛普及,运用特征选择算法对其处理成了如今大量学者们的重点研究方向.基于此,提出了一种FCBF-Lasso结合算法.首先,采用FCBF算法对各基因数据集进行特征选择,通过删除冗余的和不相关的特征,得到特征子集;然后,再利用Lasso方法对得到特征子集进行特征选择,进一步地删除冗余特征,得到对应基因数据集的最优特征子集.算法采用FCBF算法的对称不确定性和Lasso方法的最小残差平方和作为度量特征之间以及特征与类之间相关性的评价准则,在一定程度上克服了两种算法的缺点.在6个基因数据集上与其它3种经典的特征选择算法进行比较,结果表明算法在选择最少特征数的最优特征子集和分类精度方面具有很好的优势.  相似文献   

7.
特征选择是目标分类的一项重要步骤,直接影响到分类器的设计和性能。本文利用实际水声目标辐射噪声数据,对遗传算法和互信息算法两种特征选择方法分别作了分析。在特征维数较大的情况下,两种方法都需要很长的计算时间,为此,提出一种遗传与互信息混合算法,旨在降低计算时间。最后,分类器用三种选择后的特征子集作为输入进行分类,并与任意选择的特征子集作为输入的分类结果作了比较。  相似文献   

8.
实时网络数据包含大量冗余术语和噪声,而现有入侵检测技术准确度较低,特征提取能力不足。针对NSL-KDD数据集,提出了一种基于决策树的网络入侵检测系统。采用相关特征选择子集评价方法进行特征选择并减小维数,消除冗余数据,提高资源利用率并降低时间复杂度,通过特征选择可提高入侵检测方法预测性能。在特征选择之前和特征选择之后,对五类分类和二类分类进行性能评估。结果表明,该系统具有较高检出率和精度,数据集二类分类总体结果高于五类分类,可为网络安全检测工作提供借鉴。  相似文献   

9.
针对高光谱图像谱段数目较多、近邻谱段相关性过高而导致分类困难的问题,提出了一种自适应差分进化特征选择的高光谱图像分类算法.首先初始化种群向量集,利用自适应差分进化算法搜索特征的自适应性生成特征子集;然后,通过使用ReliefF技术根据特征排序去除重复特征,从而为所有的特征构建一个特征列表;最后,借助于模糊k-近邻分类器计算每个向量的分类精度,利用包裹模型评估特征子集.在印第安纳数据集和KSC数据集上的实验结果验证了算法的有效性及可靠性,实验结果表明,相比其他几种特征选择算法,该算法取得了更高的总分类精度和更好的Kappa系数.  相似文献   

10.
侯榜焕  姚敏立  贾维敏  沈晓卫  金伟 《红外与激光工程》2017,46(12):1228001-1228001(8)
高光谱遥感图像具有特征(波段)数多、冗余度高等特点,因此特征选择成为高光谱分类的研究热点。针对此问题,提出了空间结构与光谱结构同时保持的高光谱数据分类算法。考虑高光谱图像的物理特性,首先对图像进行加权空谱重构,使图像的空间结构信息自动融入光谱特征,形成空谱特征集;对利用最小二乘回归模型保存数据集的全局相似性结构的基础上,加入局部流形结构正则项,使挑选的特征子集更好地保存数据集的内在本质结构;讨论了窗口大小和正则参数对分类精度的影响。对Indian Pines、PaviaU和Salinas数据集的实验表明,该算法得到的特征子集的总体分类精度达到93.22%、96.01%和95.90%。该算法不仅充分利用了高光谱图像的空间结构信息,而且深入挖掘了数据集的内在本质结构,从而得到更有鉴别性的特征子集,相比传统方法明显提高了分类精度。  相似文献   

11.
Texture classification using logical operators   总被引:2,自引:0,他引:2  
In this paper, a new algorithm for texture classification based on logical operators is presented. Operators constructed from logical building blocks are convolved with texture images. An optimal set of six operators are selected based on their texture discrimination ability. The responses are then converted to standard deviation matrices computed over a sliding window. Zonal sampling features are computed from these matrices. A feature selection process is applied and the new set of features are used for texture classification. Classification of several natural and synthetic texture images are presented demonstrating the excellent performance of the logical operator method. The computational superiority and classification accuracy of the algorithm is demonstrated by comparison with other popular methods. Experiments with different classifiers and feature normalization are also presented. The Euclidean distance classifier is found to perform best with this algorithm. The algorithm involves only convolutions and simple arithmetic in the various stages which allows faster implementations. The algorithm is applicable to different types of classification problems which is demonstrated by segmentation of remote sensing images, compressed and reconstructed images and industrial images.  相似文献   

12.
Li ZHANG  Cong WANG 《通信学报》2018,39(5):111-122
Feature selection has played an important role in machine learning and artificial intelligence in the past decades.Many existing feature selection algorithm have chosen some redundant and irrelevant features,which is leading to overestimation of some features.Moreover,more features will significantly slow down the speed of machine learning and lead to classification over-fitting.Therefore,a new nonlinear feature selection algorithm based on forward search was proposed.The algorithm used the theory of mutual information and mutual information to find the optimal subset associated with multi-task labels and reduced the computational complexity.Compared with the experimental results of nine datasets and four different classifiers in UCI,the proposed algorithm is superior to the feature set selected by the original feature set and other feature selection algorithms.  相似文献   

13.
刘云  肖雪  黄荣乘 《信息技术》2020,(5):28-31,36
特征选择是机器学习和数据挖掘中处理高维数据的初步步骤,通过消除冗余或不相关的特征来识别数据集中最重要和最相关的特征,从而提高分类精度和降低计算复杂度。文中提出混合蒙特卡罗树搜索特征选择算法(HMCTS),首先,根据蒙特卡罗树搜索方法迭代生成一个初始特征子集,利用ReliefF算法过滤选择前k个特征形成候选特征子集;然后,利用KNN分类器的分类精度评估候选特征,通过反向传播将模拟结果更新到迭代路径上所有选择的节点;最后,选择高精度的候选特征作为最佳特征子集。仿真结果表明,对比HPSO-LS和MOTiFS算法,HMCTS算法具有良好的可扩展性,且分类精度高。  相似文献   

14.
网络流量特征选择方法中的分治投票策略研究   总被引:1,自引:0,他引:1       下载免费PDF全文
特征选择作为机器学习过程中的预处理步骤,是影响分类性能的关键因素.网络流量具有数据量大,特征维度高的特点,如何快速提取特征子集,并提高分类效率对于基于机器学习的流量分类方法具有重要意义.本文提出基于分治与投票策略的特征提取方法,将数据集分裂为多个子集,分别执行特征提取算法,利用投票方法获得最后的特征子集.实验表明可有效提高特征提取的时间效率,同时使分类器取得良好的分类准确率.  相似文献   

15.
Artificial neural networks (ANNs) can be used successfully to detect faults in rotating machinery. Using statistical estimates of the vibration signal as input features. In any given scenario, there are many different possible features that may be used as inputs for the ANN. One of the main problems facing the use of ANNs is the selection of the best inputs to the ANN, allowing the creation of compact, highly accurate networks that require comparatively little preprocessing. The paper examines the use of a genetic algorithm (GA) to select the most significant input features from a large set of possible features in machine condition monitoring. Using a GA, a subset of six input features is selected from a set of 66 giving a classification accuracy of 99.8%, compared with an accuracy of 87.2% using an ANN without feature selection and all 66 inputs. From a larger set of 156 different features, the GA is able to select a set of six features to give 100% recognition accuracy  相似文献   

16.
韩萍  孙丹丹 《信号处理》2019,35(6):972-978
给出了一种特征选择与深度学习相结合的极化合成孔径雷达(polarimetric synthetic aperture radar, PolSAR)图像有监督分类算法。该算法首先根据极化SAR图像数据以及目标分解获取原始特征参数集,然后利用随机森林(Random Forest, RF)方法对特征参数集进行重要性评估,并根据特征重要性排名选择最优极化特征。以最优极,化特征为输入,通过卷积神经网络(convolutional neural network, CNN)学习多层特征信息,再利用训练好的网络模型对极化SAR图像进行分类。利用美国AIRSAR机载系统采集的实测数据进行实验,并同已有经典有监督分类算法进行比较,结果表明本文算法能够选取有效的极化特征,最终得到较为准确的分类效果。   相似文献   

17.
利用SVM的极化SAR图像特征选择与分类   总被引:1,自引:0,他引:1  
该文提出一种新的利用SVM的特征选择算法,并将其融入到极化SAR图像分类过程中,构成一种新的基于SVM的分类方法.其中,特征选择算法利用支持向量个数作为特征评估指标,并以顺序后退法作为搜索策略.真实数据的实验结果表明,该分类方法能有效降低SVM分类器对自身参数的敏感性,与利用原始特征集和经典的RELIEF-F的分类方法相比,该方法能以更少(或相当)的特征个数,在更广泛的SVM参数取值范围内获得更高的分类精度.  相似文献   

18.
In designing pattern classification systems for a small number of training samples, investigators have quoted that there exists an optimal number of features one can use. This number is a function of the number of training samples and the probability structure of the data. A recursive algorithm is given for selecting a near optimal feature set for classifying a data set consisting of two classes described by two equiprobable multivariate normal densities with a common covariance matrix. We compare this near optimal feature selection algorithm with the optimal exhaustive search algorithm and discuss examples for both algorithms.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号