共查询到19条相似文献,搜索用时 46 毫秒
1.
面向现代战场中各类感知设备产生海量实时数据,消除冗余及无关数据是提升信息质量,降低军事信息系统资源开销的关键技术。提出了一种基于特征选择的数据降维方法,实验结果表明该方法能够大幅消减噪音数据,有效提升信息质量,降低系统开销,适用于现代战争环境。 相似文献
2.
《信息技术》2019,(2):53-57
随着信息技术的飞速发展以及网民规模的扩大,互联网数据量与日俱增,其中含有大量非结构化文本数据,因此,文中分类已成为当前的研究热点。特征选择的好坏直接影响文本分类的精度。传统单一的特征选择方法侧重点不同,使用不同的特征选择方法选择后的特征子集可能差别较大,进而导致不稳定的分类结果。文中提出了一种混合CHI与IG的特征选择方法,引入了融合特征的指标SOM(Score of Mixed),将特征根据SOM值排序,通过预定的阈值进行特征筛选,得出相对稳定且具代表性的特征子集。实验结果表明,使用该方法进行特征选择,文本分类的效果相比使用其他特征选择方法有一定的提升。 相似文献
3.
提出了结合情感词典的改进信息增益特征选择方法。首先,针对现有的信息增益特征选择存在注重特征词的文档频率而忽视语料均衡等问题,提出了改进方法。其次,考虑情感词对文本分类的影响,提出了基于情感词典的特征选择(information gain combining sentiment classification,IGSC)算法进行文本分类。该算法通过对文本情感词进行匹配并结合情感词赋权重,实现了特征降维并解决了文本数据稀疏影响分类性能的问题;最后,针对旅游评论数据集对所提出的特征选择方法进行了实验验证及分析。实验结果表明,本文提出的改进文本情感分类特征选择方法在分类准确率、召回率和F值方面均得到了提升,并且具有较好的分类稳定性。 相似文献
4.
5.
6.
7.
基于TSVM分类算法和混合型特征选择方法,提出了一种网络入侵检测的新方法,能够高效地检测网络入侵.通过大量基于著名的KDD Cup 1999数据集的实验,表明其相对于传统的入侵检测方法在保证较高检测率的前提下,有效地降低了误报率. 相似文献
8.
10.
在大数据时代,特征选择是对数据进行预处理的必要环节.特征选择作为一种数据降维技术,其主要目的是从原始数据中选择出对算法最有益的相关特征,降低数据的维度和学习任务的难度,提升模型的效率.现阶段,有关特征选择算法方面的研究已取得阶段性成效,但也面临着重大挑战,其中维度灾难就是特征选择与分类问题所面临的重大挑战.首先,介绍了... 相似文献
11.
特征点是图像中常用的局部特征结构,现有的检测算子旨在提取图像中所有符合某一准则的特征点,往往会在同一位置得到大量的特征点,形成对图像局部区域的过描述,增加了高层处理任务的运算量。为了选取出一定数量较好的特征点来描述图像,常用方法是根据特征点响应函数来选取响应值大于某一阈值的特征点,但是这种选取方法并没有考虑特征点的分布均匀性和独特性,而特征点的分布均匀程度和独特性对于图像匹配的结果同样具有重要的影响。为此提出了一种新的特征点选取方法,首先基于检测算子得到的特征点构造最小生成树,然后定义特征点分布均匀性和独特性等选取准则,再通过删剪最小生成树,选取符合(准)最优准则的一组特征点。实验表明,该方法选取的特征点在图像描述和图像匹配等任务中优于传统的特征点选取方法。 相似文献
12.
特征选择在模式分类中扮演了一个重要的角色。它的目标是尽可能多地将不相关特征排除在外,同时,得到区分度大的特征子集。那些信息量小的特征的存在,不仅使得学习算法表现不佳,而且会掩盖数据背后重要的本质信息。随着新兴技术的发展,在很多领域数据集变得越来越大,很多不相关特征通常会出现在这样的数据集中,使得传统的学习算法遇到了巨大的挑战,尤其在效率和推广性方面。于是,一种可以从数据集中消除冗余和非相关信息的算法变得十分必要。本文提出一种boosting策略的特征选择方法,利用基于核空间的距离评价函数,采用前向分步搜索方法,为核向量机(CVM)分类器选择特征子集。实验结果显示,这种方法和非boosting策略,以及其他评价方法相比,能给分类器带来更优的特征。 相似文献
13.
量子GA-PLS特征选择算法及其应用 总被引:1,自引:0,他引:1
为进一步提高遗传算法-偏最小二乘法的计算速度和计算效率,将量子算法融合到遗传算法-偏最小二乘法中,提出一种新的特征选择方法—量子遗传算法-偏最小二乘法(Quantum Genetic Algorithm-Partial Square Least,QGA-PLS)算法。该方法利用量子态和叠加态原理对染色体进行编码,采用量子旋转门进行遗传操作,以实现参数的更新和增强种群多样性,同时,用量子计算重新构建了偏最小二乘法回归模型来计算个体适应度,以充分发挥快速收敛和全局优化能力。将方法应用于函数极值优化和Iris数据集的特征选择,实验结果表明,QGA-PLS在特征选择、运算时间和分类准确率方面优于QGA和GA-PLS,从而验证了QGA-PLS算法的有效性。 相似文献
14.
15.
16.
在开放式网络中,高维混合特征的冗余或不相容属性会降低网络入侵检测的效率.为提高入侵检测系统的响应性能,提出一种混合特征选择方法,利用粗糙集形式化描述入侵检测的特征选择,采用信息熵和平均权重分别定义数值型和字符型特征的重要度.算法产生降序特征序列,采用K-means聚类算法评估出优化特征子集.在KDD CUP99数据集上的仿真实验表明,算法有效选择特征子集并缩短了检测时间. 相似文献
17.
针对目标与背景两类图像模式识别问题,在已有的特征选择方法基础上,提出了一种新颖的基于免疫分子编码机理的图像特征选择方法(Immune Antibody Construction Algorithm,IACA).该方法借鉴生物免疫系统的抗体分子编码机理,在对样本进行参数估计情况下,提出熵度量单个特征对于目标和背景的识别敏感度;从集合的角度研究并且定义了特征之间的包含和互补关系;并且基于组成抗体分子氨基酸结合能量最小原则,提出了关于图像目标的免疫抗体构建规则;最终实现了寻找最优特征子集的算法IACA,该特征子集的维数通过算法自动获得无需人为设定,选择结果为目标的"免疫抗体",能很好的从背景中识别目标.利用归纳法证明了用IACA得到的特征子集的最优性.与其他特征选择方法比较,测试结果显示该算法具有较低的计算复杂度和错误识别率,表明了该方法的优越性和先进性. 相似文献
18.
Journal of Signal Processing Systems - Labeling of data is often difficult, expensive, and time consuming since efforts of experienced human annotators are required, and often we have large number... 相似文献