共查询到20条相似文献,搜索用时 31 毫秒
1.
针对生物组学数据高维小样本的特点而引起的分类误差较大的问题,提出了一种带约束小生境二进制粒子群优化的集成特征选择方法。该方法利用二进制粒子群优化算法搜索分类准确率最高的特征子集,通过约束粒子编码的置位个数以限制选择特征个数,并加入多模优化中的小生境技术使算法能够一次获得多个差异度较大的特征子集,最后采用集成学习技术将基于多特征子集建立的基分类器集成为强分类器并对数据进行分类学习。实验结果表明,该特征选择方法在生物组学数据上能够稳定选择较少特征并获得较好分类性能。 相似文献
2.
3.
在高维特征选择过程中最优特征子集生成和分类器 参数优化方面,提出一种基于贝叶斯粗糙集(BRS)、遗传算法(GA)和布谷鸟算法(CS) 的两阶段优化高维特征选择算法。该算法首先分析3000例肺部肿瘤CT图像的形状、灰度和纹理特征,提取104维特 征分量共同量化ROI;然后进行两阶段优化:(1) 从全局相对增益函数的角度分析了属性 重要度,结合属性约简长度和基因编码权值函数的加权和构造适应度函数,通过选择、交叉 和变异等遗传操作生成最优特征子集,在不降低分类精确度的前提下降低特征维度;(2) 利用CS对支持向量机(SVM)参数进行全局寻优;最后通过实验验证本文算法的可行性和有 效性。实验结果表明,该算法有效提升了肺部肿瘤良恶性识别能力,降低了算法的时间复杂 度。 相似文献
4.
针对传统免疫网络分类算法在记忆细胞确定上缺乏有效的指导,该文提出一种基于动态识别邻域的免疫网络分类算法。算法采用核函数表示机制来描述抗体-抗原之间的亲和度;利用抗原对构造动态识别邻域来指导抗体群体的进化,并选择邻域中距离对偶抗原最近的抗体为记忆细胞。算法被应用于多分类问题及高维分类问题来进行算法性能分析,同时,算法被应用于多个标准数据集的分类来评估算法的整体性能。分类结果表明该算法对于标准测试数据集有良好的分类性能,这说明基于动态识别邻域的训练方法能够有效地指导记忆细胞的生成,显著地改善分类器的性能。 相似文献
5.
6.
特征选取和参数设置是提升支持向量机分类器的效果的两个主要手段.为了将两者结合起来,实现同步优化,以达到更好的分类效果,设计了一种基于粒子群算法的分类器优化算法.新算法对粒子采用2进制编码的,设计适合的目标函数,同步进行特征选择和支持向量机参数的优化.经过对比验证,新方法能够更加准确的得到待分类数据的特征子集跟支持向量机参数,最终得到更优的处理结果. 相似文献
7.
提出了一种基于支撑向量机的多类分类器,用N-1个支撑向量机组合构成一个具有二叉树结构形式的N-多类分类器.讨论了该多类分类器的泛化推广能力,同时还提出了该多类分类器的基于特征空间的BTSVM学习算法,BTSVM算法使用核函数转换的方式计算特征空间的样本距离;采用类间最小距离最大化作为聚类准则,在每个决策结点产生两个最优子集;然后采用支撑向量机学习算法学习两个最优子集,确定决策结点的最优分类面.理论和实验结果表明,本文提出的基于支撑向量机的多类分类器在整体性能上要优于其它类似的分类器系统。 相似文献
8.
9.
10.
11.
提出了基于优化的随机子空间分类集成算法CEORS,该算法通过运用封装式特征选择和LSA降维两种方法对随机选择的特征子集进行了优化,并运用优化的特征子空间进行分类器的集成.实验结果表明,基于优化特征子空间的集成分类器性能优于Bagging和AdaBoost. 相似文献
12.
Filter特征选择算法具有通用性强、算法复杂度低的特点,但对某一个具体的分类器选择的特征子集也许并不是最优的;Wrapper方法与其相反,对特定的分类器可以找到最优的特征子集,但算法复杂度很高.研究一种Filter与Wrapper相结合的混合型算法.首先从特征对样本分类效果的角度提出互补系数的概念,然后基于ReliefF评估和互补系数,提出ReCom算法.实验证明,由ReCom算法得到的特征子集与ReliefF算法得到的特征子集相比具有更好的性能,并且与传统Wrapper方法相比,该算法大大降低了时间复杂度. 相似文献
13.
特征选择是机器学习、自然语言处理和数据挖掘等领域中数据预处理阶段必不可少的步骤.在一些基于信息论的特征选择算法中,存在着选择不同参数就是选择不同特征选择算法的问题.如何确定动态的非先验权重并规避预设先验参数就成为一个急需解决的问题.该文提出动态加权的最大相关性和最大独立性(WMRI)的特征选择算法.首先该算法分别计算新分类信息和保留类别信息的平均值.其次,利用标准差动态调整这两种分类信息的参数权重.最后,WMRI与其他5个特征选择算法在3个分类器上,使用10个不同数据集,进行分类准确率指标(fmi)验证.实验结果表明,WMRI方法能够改善特征子集的质量并提高分类精度. 相似文献
14.
特征选择是机器学习、自然语言处理和数据挖掘等领域中数据预处理阶段必不可少的步骤。在一些基于信息论的特征选择算法中,存在着选择不同参数就是选择不同特征选择算法的问题。如何确定动态的非先验权重并规避预设先验参数就成为一个急需解决的问题。该文提出动态加权的最大相关性和最大独立性(WMRI)的特征选择算法。首先该算法分别计算新分类信息和保留类别信息的平均值。其次,利用标准差动态调整这两种分类信息的参数权重。最后,WMRI与其他5个特征选择算法在3个分类器上,使用10个不同数据集,进行分类准确率指标(fmi)验证。实验结果表明,WMRI方法能够改善特征子集的质量并提高分类精度。 相似文献
15.
本文的研究工作为通信信号调制识别提供了新的思路和方法,同时对邻域粗糙集在通信信号识别中的应用进行了尝试。在对已有研究进行分析的基础上,针对现实中通信调制信号含有连续型属性的决策系统的约简问题,本文提出了基于邻域粒化和贪心算法的约简算法。该方法采用基于邻域等价关系建立粗糙集模型,用邻域等价度量粗糙集不可分辨关系,通过邻域信息粒子逼近论域空间。构造了连续型属性的特征选择算法。利用本文提出的特征选择算法识别2ASK、BPSK、2FSK、4ASK、QPSK、4FSK、16QAM。实验结果证明了该算法的有效性和可行性。 相似文献
16.
17.
18.
一种新的人工免疫网络算法及其在复杂数据分类中的应用 总被引:4,自引:0,他引:4
作为一种新的智能计算方法,人工免疫网络已被广泛的应用到模式识别以及数据分类中。现有的人工免疫网络分类算法大都存在两个缺陷:一是网络规模庞大、计算复杂;二是对抗原的一次递呈并不能保证获得全局最优分类器。该文提出了一种新的人工免疫网络分类算法,该算法利用每个类别对应单个B细胞的策略,简化网络规模并减少了同类别B细胞之间的抑制操作,同时引入了新的基于对训练样本正确识别率的亲合度评价函数,实现了基于抗原的优先级的选择策略。采用5组UCI的线性数据和4组混合特征数据以及1幅SAR图像对算法的性能进行了全面测试,结果表明,与模糊C均值算法,多值免疫(MVIN)算法和基于分类问题的克隆选择算法(CSA)相比,新算法在分类精度上具有一定的优势,鲁棒性更好。 相似文献
19.
充分、有效地利用目标全极化HRRP的特征信息是提高对海雷达目标识别率的研究热点之一。该文利用CST软件仿真建立了7类海上目标在不同方位角下的全极化HRRP数据库。在此基础上,提取了4类共39个特征。提出一种基于归一化互信息(NMI)并利用模拟退火(SA)算法进行优化的全局最优特征选择算法,并命名为NMI-SA。基于HRRP数据集以及9个UCI数据集,利用k-近邻分类器将该算法与另外3种常用的特征选择算法进行对比,结果表明新算法选择的特征具有良好的可分性和较低的冗余度,最终用于分类时的正确率总体优于其余3种算法。最后,用该算法对全极化HRRP的39个特征进行重点分析,选择出25个辨别力强、冗余度低的特征。 相似文献
20.
为了克服原始教学优化算法在求解复杂多峰函数时全局寻优精度不高和过早收敛的缺点,提出一种矩形邻域结构和个体扰动的教学优化算法.算法将种群空间设计为矩形结构,个体的矩形邻域由矩形厚度和围绕其的矩形区域个体决定,教和学两个阶段都使用邻域最优个体引导搜索,加强了算法勘探新解和开发局部最优解的能力;为了防止算法过早陷入局部最优,增加了基于搜索边界信息引导的个体扰动阶段,使得种群即使在进化的后期仍能保持较好的多样性.对带有偏移和旋转的复杂函数进行仿真测试,结果表明新算法在求解精度和稳定性方面,在绝大多数情况下优于原始教学算法和其他一些近来的优秀改进教学算法. 相似文献