首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 609 毫秒
1.
特征选择作为一种常见的降维方法,一直以来都是机器学习和数据挖掘领域的热点话题.针对传统特征选择算法没有充分考虑特征全局冗余性,导致选择的特征子集对分类识别精度不够高的问题,提出基于复杂网络节点重要度评估和遗传算法的特征选择算法,将每个特征视为网络节点,根据互信息建立边,将特征选择问题转化为节点重要度评估问题,利用遗传算法选择最优特征子集.实验结果表明此算法能够找到较为优秀的特征子集,有效降维并提高分类精度.  相似文献   

2.
一种快速的Wrapper式特征子集选择新方法   总被引:1,自引:0,他引:1  
Wrapper式特征选择方法需要耗费大量时间,为此提出了一种快速的Wrapper式特征选择新方法(Fast Feature Subset Ranking,简称FFSR).与以单个特征作为评价单位的传统方法不同,FFSR算法以特征子集作为评价单位,以子集收敛能力作为评价标准.FFSR算法从收敛速度和收敛极值两个方面对收敛能力进行分析,并利用Sequential Floating Forward Selection(简称SFFS)算法构造和评价快速收敛的子集.FFSR算法选择的特征子集能力接近SFFS算法,但所需时间较SFFS算法大幅度减少.  相似文献   

3.
特征选择是高维小样本癌症基因数据分析的首要和关键步骤,但是现有特征选择算法存在特征子集依赖于训练样本且随训练样本不同而变化的问题。为了解决特征选择过程的特征子集不稳定问题,提出一种基于核极限学习机的集成特征选择方法,利用5-折交叉验证划分原始数据,对各训练集继续采用5-折交叉验证进行划分并进行特征选择,以所得5个特征子集之并集作为该训练集的特征子集,构造核极限学习机评价该特征子集的分类性能,以原始数据集5-折交叉验证所得特征子集的平均Jaccard系数评价特征选择算法所选特征子集的稳定性。5个基因数据集的实验测试以及与经典特征选择算法SVM-RFE、LLE Score、ARCO、DRJMIM、Random Forest和mRMR的实验比较表明,本文算法不仅能选择到稳定的特征子集,且所选特征子集具有很好的泛化能力。  相似文献   

4.
机器学习领域中的特征选择算法可简化模型输入,提高可解释性并帮助避免维度灾难及过拟合现象的发生.针对基于封装法进行特征选择时,评价模型通常将搜索出的特征子集直接作为输入,导致算法对特征利用和评估效果受限于评价模型的特征学习能力,限制了对更适特征子集的发现能力等问题,提出一种基于级联森林结构的子集特征预学习封装法.该方法在搜索算法与评价模型之间添加多层级联森林,重构待评价特征子集为高级特征集,降低评价模型模式识别难度,提高对子集性能的评价效果.实验对比了多种搜索算法及评价模型组合,本方法可在保证分类性能的前提下,进一步降低所选特征数量,同时维持了封装法的低耦合性.   相似文献   

5.
集成算法是机器学习领域的研究热点。随机子空间算法是集成算法的一个主要算法。随机子空间生成的特征子集可能含有冗余特征、甚至噪声特征,影响算法的分类精度。为此,本文提出了一种基于互信息的弱随机特征子空间生成算法(WRSMI),有效去除了特征子集中的冗余特征和噪声特征。在UCI数据集上的实验结果表明,WRSMI的分类性能优于随机子空间算法。  相似文献   

6.
决策表最优特征子集的选择--基于粗集理论的启发式算法   总被引:5,自引:0,他引:5  
特征子集选择问题是机器学习的重要问题。而最优特征子集的选择是NP困难问题,因此需要启发式搜索指导求解。基于粗集理论,本文提出了一种新的决策表最优特征子集选择的启发式算法。和以往的方法相比,这种算法简单实用,在一定条件下能够以较高的效率得到最优特征子集。  相似文献   

7.
基于人工鱼群算法的储粮害虫特征选择   总被引:2,自引:1,他引:1  
储粮害虫特征选择是粮虫图像识别中的一个核心问题.提出基于人工鱼群算法的特征选择,并给出了基于二进制编码寻优的实现方法.以交叉验证训练模型的识别率作为特征子集的性能评价准则,将人工鱼群算法应用于粮虫的特征选择.该算法从粮虫的17维形态学特征中自动选择出面积、周长等7个特征所组成的最优特征子集,采用参数优化之后的SVM分类器对90个粮虫样本进行分类,识别率达到95.5%以上,并与PCA法、GA法和原始特征法进行对比,结果表明人工鱼群算法降低了特征空间的维数,提高了分类器的识别率,证实了基于人工鱼群算法的粮虫特征选择是可行的.  相似文献   

8.
一种基于条件熵的特征选择算法   总被引:1,自引:0,他引:1  
特征选择是一种处理维数约简的有效方法。以条件熵为特征子集评价条件,采用随机搜索和启发式搜索相结合的搜索策略,设计了一种新的特征选择方法。该方法不仅能够求得经典启发式特征选择方法的选到特征子集,还可以得到一些与其不同的满足条件特征子集,同时在多数情况下可以减少时间消耗。实验研究表明了提出的算法的有效性。  相似文献   

9.
孤立性肺结节诊断模型中未得到充分解决的一个关键问题就是如何选择合适的特征子集。为了构建一个良好的诊断预测模型,提高肺结节良恶性诊断的效率以及准确率,提出了一种基于联合互信息的混合模型特征子集选择算法。该算法综合过滤式和包裹式特征选择模型各自的优势,首先使用过滤式方法得到与诊断有高相关度的候选特征子集,然后通过包裹式方法对候选特征子集进行特征间冗余分析,最后得到最优特征子集。实验表明,该算法与基于其他互信息的过滤式、混合模型特征选择方法相比,不仅在特征子集数目上,而且在良恶性诊断的敏感性、特异性和平均分类准确率上,均具有很好的性能效果。  相似文献   

10.
现有过滤式特征选择模型采用贪心策略结合互信息评价特征子集,容易陷入局部最优陷阱.考虑标签信息对冗余度的影响,利用一种改进的MIFS-U方法在给定标签的条件下衡量冗余度,采用基于分解的多目标优化框架结合引入多项式突变的差分进化算子进行全局搜索,避免搜索陷入局部最优.引入l1正则化项来保证特征子集的稀疏性,并提出了新的特征选择算法MOEA/D-DEFS.实验阶段使用knn-5分类器来验证学习效果,并在多组来自不同领域的数据集上进行测试.结果表明,将特征选择视为多目标问题采用全局搜索策略搜索可以在特征子集维度和分类准确性方面提供更好的性能.  相似文献   

11.
提出一种基于调频广播(FM)信号的外辐射源雷达组网系统多传感器快速启发式算法,目的是使系统能够动态地协调各部FM信号接收机的使用,进而在资源有限的条件下达到更好的目标参数估计性能。该算法采用相干克拉美罗界(CRLB)作为代价函数,并通过贪婪快速启发式算法对优化问题进行了求解。仿真结果表明,所提算法不仅可以在系统资源有限的情况下提升目标的参数估计性能,而且可以大大减小计算量,具有很强的实用性。  相似文献   

12.
为了消除与分类无关和冗余基因,以提高基因的分类精度和效率,提出一种文化算法框架下混合群智能算法的肿瘤信息基因选择方法.首先采用ReliefF算法初选基因子集,然后利用文化算法框架下混合群智能算法选择最优的信息基因,最后在3个标准肿瘤信息基因数据集对其性能进行测试.仿真结果表明,文化算法框架下混合群智能算法可以有效去掉无用的噪声基因,降低计算复杂度,分类精度均可以达到100%,具有较好的实际应用价值.  相似文献   

13.
应用特征选择处理多标签数据分类时"维度灾难"问题已成为重要研究方向,因此提出一种基于邻域维护准则的特征选择算法(NPFS,feature selection algorithm based on neighborhood preservation criterion)。通过近似基于特征子空间和基于标签空间的2个相似度矩阵来构建相似性维护表达式,再通过线性近似扩展相似性维护公式得到邻域关系维护公式,并计算出邻域关系维护得分(NRPS,neighborhood relationship preserving score)来评估特征子集的重要性,结合贪婪方法设计具有NRPS的多标签特征选择算法(NPFS)。仿真结果表明,对比MMIFS算法和MDMR算法,所提出的算法在平均准确率、覆盖率、汉明损失、1-错误率、排名损失5个性能指标上均有改善。  相似文献   

14.
为消除人体穴位的阻抗信号特征集中存在的冗余和不相关分量的问题,提出了一种基于遗传算法的人体穴位阻抗特征子集选择与优化算法.通过分析穴位阻抗信号的自回归(AR)模型谱图建立了穴位原始特征样本集,利用类内-类间距离判据构造遗传算法的适应度函数并改进遗传算法的特征优化算子.经人体穴位的电阻抗特征选择与优化实例分析表明:该方法具有较好的寻优性能和适应度稳定,在不增加原始信息的情况下,能够有效地减少分类识别的特征数和提高信号识别的准确率,且将穴位阻抗特征的平均状态辨识率提高9%左右.  相似文献   

15.
针对特征选择问题,引入一种具有混合编码的二进制差分演化算法,融合随机和优选两种方法自适应对特征子集个数进行控制,并在评价函数中引入权重和相关性抑制.利用淋巴瘤细胞核形态特征进行实验,结果表明该方法能有效进行特征选择.  相似文献   

16.
提出了扩展的Kuhn-Munkres算法,可解决带下界约束的局部匹配存在性问题,即在匹配全集的给定子集中,搜索得到一个二分图匹配满足其边权和大于给定阈值.扩展Kuhn-Munkres算法构造了一棵以Kuhn-Munkres算法中间过程为节点的搜索树,利用搜索优先级和剪枝,将算法时间复杂度降低至二分图匹配全集与给定子集差集规模的多项式函数.   相似文献   

17.
提出了一种基于聚类的支持向量机增量学习算法.先用最近邻聚类算法将训练集分成具有若干个聚类子集,每一子集用支持向量机进行训练得出支持向量集;对于新增数据首先聚类到相应的子集,然后计算其与聚类集内的支持向量之间的距离,给每个训练样本赋以适当的权重;而后再建立预估模型.此算法通过钢材力学性能预报建模的工业实例研究,结果表明:与标准的支持向量回归算法相比,此算法在建模过程中不仅支持向量个数明显减少,而且模型的精度也有所提高.  相似文献   

18.
针对不完整决策系统属性约简算法时间复杂度较高问题,基于正域不变条件下,决策系统分类能力保持不变原则,提出不完整决策系统前向顺序特征选择算法.该算法从约简集为空集开始,根据在约简集合中加入各属性后对正域影响程度大小将属性降序排列,采用顺序前向搜索,选择当前最佳特征加入特征约简集合,确定最佳特征子集.将该算法扩展到基于邻域...  相似文献   

19.
王帆  赵春晖  张志 《应用科技》2009,36(3):11-14
针对经典PCA算法在人脸特征提取上的局限性,提出了一种基于克隆选择算法的特征选择方法.克隆选择算法的收敛速度快,具有较强的全局搜索能力,可以快速搜索到最有利于分类的特征空间;因此利用克隆选择算法对PCA变换后的特征向量进行选择,可以有效避免PCA只选择人脸轮廓信息,而忽略细节信息的不足,在人脸识别中取得了较好的效果.通过对ORL和Yale人脸库的仿真实验表明,该方法无论在识别率、降维效果还是稳定性方面,性能均优于遗传算法,不但有效降低了特征向量维数,还将人脸识别率提高到91.5%,因此研究该算法具有很强的现实意义.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号