首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 140 毫秒
1.
《现代电子技术》2019,(9):60-64
针对恶意网址检测系统的特征选择和降维问题,基于特征选择方法的优化结果提出多种特征子集。利用基于分类器的准确率和召回率等性能评价指标,采用随机森林、贝叶斯网络、J48、随机树机器学习方法,对信息增益、卡方校验、信息增益率、基于Relief值、基于OneR分类器、基于关联性规则、基于相关性等多种特征选择算法所确定的特征子集进行检测。结果表明,除基于相关性特征选择算法确定的特征子集外,其他方法确定的特征子集均具有良好的分类性能,其中基于关联性规则选择的特征子集的维度仅为5,但各分类器基于此特征子集的分类准确率均高达99%以上。  相似文献   

2.
针对雷达目标的互易性修正问题,利用机器学习理论,提出一种基于非线性表示子的极化雷达目标互易性修正方法。尝试将Krogager和Cameron目标分解方法用于宽带极化雷达目标的识别,分别基于这两种目标分解方法对宽带极化雷达目标进行特征提取,在Krogager分解中使用核非线性分类器和分类器融合方法对特征矢量进行分类,在Cameron分解中使用投票判决方法对特征矢量进行分类。仿真结果表明,所讨论的方法有较好的性能。  相似文献   

3.
基于随机化属性选择和邻域覆盖约简的集成学习   总被引:2,自引:0,他引:2       下载免费PDF全文
 提高分类模型的分类精度和可靠性是分类建模追求的目标.针对目前规则学习方法应用于分类时稳定性差以及分类精度低的问题,本文通过随机化邻域属性约简,搜索一组分类精度较高的属性子集,在不同的属性子集上采用邻域覆盖约简方法学习分类规则,得到多个规则集.最后通过简单投票融合不同规则集上的分类结果获得对象的类别.实验表明,基于随机化邻域约简的集成学习方法分类性能优于或与其它相关的分类器相当,并且在噪声扰动下具有更强的鲁棒性.  相似文献   

4.
针对SAR图像具有斑点噪声,特征提取较难的特点,提出了基于Contourlet变换和SVM的SAR图像目标识别分类算法.该算法的在特征提取时利用了Contourlet域的标准偏差进行特征提取的方法,后端用支持向量机分类器,提高分类精度.实验结果证明该分类算法能够减少SVM的特征维数,具有较好的分类性能.  相似文献   

5.
刘云  肖雪  黄荣乘 《信息技术》2020,(5):28-31,36
特征选择是机器学习和数据挖掘中处理高维数据的初步步骤,通过消除冗余或不相关的特征来识别数据集中最重要和最相关的特征,从而提高分类精度和降低计算复杂度。文中提出混合蒙特卡罗树搜索特征选择算法(HMCTS),首先,根据蒙特卡罗树搜索方法迭代生成一个初始特征子集,利用ReliefF算法过滤选择前k个特征形成候选特征子集;然后,利用KNN分类器的分类精度评估候选特征,通过反向传播将模拟结果更新到迭代路径上所有选择的节点;最后,选择高精度的候选特征作为最佳特征子集。仿真结果表明,对比HPSO-LS和MOTiFS算法,HMCTS算法具有良好的可扩展性,且分类精度高。  相似文献   

6.
实时网络数据包含大量冗余术语和噪声,而现有入侵检测技术准确度较低,特征提取能力不足。针对NSL-KDD数据集,提出了一种基于决策树的网络入侵检测系统。采用相关特征选择子集评价方法进行特征选择并减小维数,消除冗余数据,提高资源利用率并降低时间复杂度,通过特征选择可提高入侵检测方法预测性能。在特征选择之前和特征选择之后,对五类分类和二类分类进行性能评估。结果表明,该系统具有较高检出率和精度,数据集二类分类总体结果高于五类分类,可为网络安全检测工作提供借鉴。  相似文献   

7.
研究针对原发性肝癌( primary liver carcinoma, PLC)患者精确放疗后乙型肝炎病毒( Hepatitis B virus, HBV)再激活分类预测模型,采用logistic提取关键特征子集,发现外放边界、肿瘤分期TNM和HBV DNA水平是HBV再激活的危险因素( P <0.05)。建立BP神经网络分类预测模型,对原发性肝癌初始数据集和关键特征子集进行HBV再激活分类预测。实验结果表明,BP 网络对HBV再激活有着良好的分类预测性能,分类预测准确性从73.33%提高到78.89%,关键特征子集分类预测准确性高于初始数据集分类预测准确性,表明了特征提取后的关键特征子集具有优秀的类别区分性。  相似文献   

8.
特征子集选择问题一直是人工智能领域研究的重要内容。特征子集选择算法研究是机器学习和数据挖掘等领域的研究热点。提出了基于差异演化算法的特征子集选择算法,实验证明该算法是简单、正确、有效的,并具有良好的收敛性和稳定性。  相似文献   

9.
针对人脸深度图像的分类识别问题展开研究,提出一种自适应3DLBP(3D Local Binary Pattern,3DLBP)特征提取算法.该特征提取算法以机器学习理论为基础,首次将反馈学习理论与3DLBP特征提取过程相结合,以保证特征提取算法对训练样本集的变化具有理想的普适性;同时,为了提高自适应特征提取算法的稳定性,提出使用多分类器对反馈学习过程进行优化.实验结果表明,自适应3DLBP特征对训练样本集的变化具有较好的有效性和稳定性,在FRGCv2.0人脸数据库上取得了理想的识别效果.  相似文献   

10.
降维技术能提高入侵检测分类器的学习效率和检测速度。针对目前入侵检测数据特征降维力度不足,提出了一种基于主成分的分类特征的分析方法。然后把样本数据按照所需的规则分割成多个子集,对每个子集进行主成分分析。实验的结果表明采用分类的方法能够更加有效地降低数据的维数,学习速度与检测速度都得到了提高。  相似文献   

11.
针对生物组学数据高维小样本的特点而引起的分类误差较大的问题,提出了一种带约束小生境二进制粒子群优化的集成特征选择方法。该方法利用二进制粒子群优化算法搜索分类准确率最高的特征子集,通过约束粒子编码的置位个数以限制选择特征个数,并加入多模优化中的小生境技术使算法能够一次获得多个差异度较大的特征子集,最后采用集成学习技术将基于多特征子集建立的基分类器集成为强分类器并对数据进行分类学习。实验结果表明,该特征选择方法在生物组学数据上能够稳定选择较少特征并获得较好分类性能。   相似文献   

12.
Network traffic classification method basing on CNN   总被引:1,自引:0,他引:1  
Since the feature selection process will directly affect the accuracy of the traffic classification based on the traditional machine learning method,a traffic classification algorithm based on convolution neural network was tailored.First,the min-max normalization method was utilized to process the traffic data and map them into gray images,which would be used as the input data of convolution neural network to realize the independent feature learning.Then,an improved structure of the classical convolution neural network was proposed,and the parameters of the feature map and the full connection layer were designed to select the optimal classification model to realize the traffic classification.The tailored method can improve the classification accuracy without the complex operation of the network traffic.A series of simulation test results with the public data sets and real data sets show that compared with the traditional classification methods,the tailored convolution neural network traffic classification method can improve the accuracy and reduce the time of classification.  相似文献   

13.
基于CHI与遗传算法的特征选择   总被引:1,自引:0,他引:1  
在基于Web文本信息过滤系统中通过特征选择找到的最优特征子集直接影响到分类的速度及精度。针对此问题,提出了综合CHI及遗传算法的特征选择方法。首先针对原始特征集,采用CHI统计法进行初始筛选,去除冗余特征及噪声后,对得到的特征子集再采用遗传算法进行第二次特征选择,从而得出代表问题空间的最优特征子集,实现降维并提高了分类精度。  相似文献   

14.
入侵检测中基于SVM的两级特征选择方法   总被引:2,自引:0,他引:2  
针对入侵检测中的特征优化选择问题,提出基于支持向量机的两级特征选择方法。该方法将基于检测率与误报率比值的特征评测值作为特征筛选的评价指标,先采用过滤模式中的Fisher分和信息增益分别过滤噪声和无关特征,降低特征维数;再基于筛选出来的交叉特征子集,采用封装模式中的序列后向搜索算法,结合支持向量机选取最优特征子集。仿真测试结果表明,采用该方法筛选出来的特征子集具有更好的分类性能,并有效降低了系统的建模时间和测试时间。  相似文献   

15.
特征选择是目标分类的一项重要步骤,直接影响到分类器的设计和性能。本文利用实际水声目标辐射噪声数据,对遗传算法和互信息算法两种特征选择方法分别作了分析。在特征维数较大的情况下,两种方法都需要很长的计算时间,为此,提出一种遗传与互信息混合算法,旨在降低计算时间。最后,分类器用三种选择后的特征子集作为输入进行分类,并与任意选择的特征子集作为输入的分类结果作了比较。  相似文献   

16.
杜敏  陈兴蜀  谭骏 《中国通信》2011,8(2):52-58
Peer-to-Peer technology is one of the most popular techniques nowadays, and it brings some security issues, so the recognition and management of P2P applications on the internet is becoming much more important. The selection of protocol features is significant to the problem of P2P traffic identification. To overcome the shortcomings of current methods, a new P2P traffic identification algorithm is proposed in this paper. First of all, a detailed statistics of traffic flows on internet is calculated. Secondly, the best feature subset is chosen by binary particle swarm optimization. Finally, every feature in the subset is given a proper weight. In this paper, TCP flows and UDP flows each have a respective feature space, for this is advantageous to traffic identification. The experimental results show that this algorithm could choose the best feature subset effectively, and the identification accuracy is improved by the method of feature weighting.  相似文献   

17.
高光谱图像分类是近年来的研究热点。其数据的 高维性引发了“维度灾难”问 题。数据降维成为解决问题的关键。针对高光谱数据有标记训练样本点匮乏的特点, 提出用无监督的特征选择方法对高光谱数据进行降维。该方法能够同时保持原始高光 谱数据的判别能力和局部几何结构。为了保持判别能力,用所选特征对原始高光谱数 据进行重构,利用重构误差最小化将特征选择问题转化为优化问题。为了保持局部几 何结构,建立近邻图,并将其转化为正则项加入目标函数中。通过迭代梯度下降方法 解此优化问题,得出优选特征子集参与高光谱图像分类识别任务。在真实数据集上的 实验表明,新方法能够提高分类识别的精度。  相似文献   

18.
Feature selection is one of the important topics in text classification. However, most of existing feature selection methods are serial and inefficient to be applied to massive text data sets. In this ease, a feature selection method based on parallel collaborative evolutionary genetic algorithm is presented. The presented method uses genetic algorithm to select feature subsets and takes advantage of parallel collaborative evolution to enhance time efficiency, so it can quickly acquire the feature subsets which are more representative. The experimental results show that, for accuracy ratio and recall ratio, the presented method is better than information gain, x2 statistics, and mutual information methods; the consumed time of the presented method with only one CPU is inferior to that of these three methods, but the presented method is superior after using the parallel strategy.  相似文献   

19.
现有图像分类大都采用单一特征,不能利用多个特征之间性能互补优势,且将特征选择与分类器构造分割开来,影响图像分类的精度和分类器的泛化能力。针对以上问题提出一种基于混沌二进制粒子群算法(CBPSO)的特征选择和SVM参数同步优化方法,利用图像的综合特征,将特征选择和SVM分类器构造结合同步优化,仿真实验结果表明,该算法能同步找出最优的特征子集和合适的SVM参数,提高了图像分类精度和分类器泛化能力。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号