首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 906 毫秒
1.
由于候选特征与类标签间的相关性,候选特征、已选特征与类标签间的交互性以及特征间的冗余性是特征选择算法应考虑的重要因素,而一些基于互信息和三维互信息的特征选择算法没有同时考虑相关性、交互性和冗余性信息,这影响了它们的性能。针对该问题,提出一种采用冗余性动态权重的特征选择算法,将对称不确定性和三路交互信息作为评价指标,采用一种动态更新特征权重的方法使目标函数在考虑相关性、交互性的基础上,同时考虑特征间的冗余性。在10种数据集上利用3种分类器与典型的基于互信息的特征选择算法做了对比实验,结果表明所提算法具有更好的特征选择性能。  相似文献   

2.
为了实现非平稳复杂背景干扰下的红外小目标检测,在特征选择阶段同时考虑了目标的强度、分布梯度以及与背景之间的阶越特性,并提取对比度、临域标准差以及多孔小波变换高频分量的模值三维特征予以描述.将目标检测过程视为特征空间中的两类分类问题,通过主分量分解获取背景的统计聚类参数,将目标像素特征向量视为背景特征聚类之外的异常点,并...  相似文献   

3.
特征选择是生物信息领域中数据预处理阶段必不可少的步骤。传统特征选择算法忽视了特征之间的依赖相关性和冗余性,因此提出一种联合互信息的特征选择算法(JFRR)。该算法利用互信息计算特征之间的冗余值,并利用联合互信息分别计算已选特征集合、候选特征及类标签之间的相关性。将JFRR与其他6个特征选择算法在2个分类器上,使用9个不同基因数据集,进行分类准确率指标(Precision_micro和F1_micro)验证。实验结果表明,该算法能有效提高分类精度。  相似文献   

4.
随着城市公交线路发展的加速,公交最佳路径的选择已成为人们出行亟待解决的问题.模型中通过对乘车方式进行分类,针对乘客出行的不同需求,同时考虑步行因素,运用Dijkstra算法并通过层次分析法构建因素指标,从而寻找出行的最优路径,较好地解决了交通网络模型问题.  相似文献   

5.
为解决特征选择中分辨特征之间的依赖和冗余问题,采用动态权重最大相关最小冗余算法(DWMRMR),在5个公共数据集上进行了验证以及算法比较.  相似文献   

6.
为解决特征选择中分辨特征之间的依赖和冗余问题,采用动态权重最大相关最小冗余算法(DWMRMR),在5个公共数据集上进行了验证以及算法比较.  相似文献   

7.
作为一种基于一范式的特征选择方法,Lasso算法具有能够准确、迅速且稳定地选择出重要变量的特性.在面对物联网的数据集时,可以通过这一算法进行特征选择降低分类算法的计算消耗.分布式均分Lasso算法是一种结合Hadoop分布式计算与均分Lasso算法的融合算法,通过对特征集的拆分、对特征子集的并行化特征选择以及矩阵运算的并行化来提高算法运算效率,解决传统Lasso算法在高维度数据集以及小样本数据集上遇到的问题.通过对比实验可知这一算法的可行性、准确性与效率.  相似文献   

8.
为识别齿轮裂纹的严重程度信息,提出一种基于有序分类的故障严重程度识别方法.将故障严重程度识别问题视为不同严重程度之间存在序结构,并且部分特征和故障严重程度之间存在单调依赖关系的有序分类问题,从有序分类出发,建立有序分类的故障严重程度识别模型.研究故障严重程度识别中的特征评价和特征选择问题,利用排序互信息指标区分原始特征集中的单调特征和非单调特征,提出单调特征和非单调特征混合存在情况下的有序分类特征选择算法.齿轮裂纹程度识别实验结果表明:提出的有序分类特征选择算法可以降低特征空间维数,能选择出分类能力强的故障特征子集,提高了故障严重程度识别的准确性.  相似文献   

9.
在开放动态环境下分类学习的任务中,数据通常存在类别长尾分布的特点,且数据标记空间存在层次化结构关系以及动态性.针对实际任务中不同的需求,许多特征选择算法被提出,但是这些已有的特征选择算法忽略数据的长尾分布特点和特征空间的不确定性.针对上述问题,文中提出基于邻域粗糙集的长尾分布数据在线流特征选择算法.借助邻域粗糙集模型,并考虑邻域内样本间的关系后,定义了自适应邻域关系,设计基于稀有类样本重要性的依赖度计算公式.同时,利用层次结构降低类别不平衡性,提出在线冗余度分析和在线重要度分析两种在线特征评价指标,用于选出具有高可分离性和强区分性的特征子集.实验结果表明所提算法优于其它先进算法.  相似文献   

10.
当前主流分类方法在分类决策时无法同时考虑样本的全局特征和局部特征,而且大多算法仅关注各类样本的可分性,往往忽略样本之间的相对关系。为了解决上述问题,提出了基于流形判别分析的全局保序学习机。该方法引入流形判别分析来反映样本的全局特征和局部特征;通过保持各类样本中心的相对关系不变进而实现保持全体样本的先后顺序不变;借鉴核心向量机有关理论和方法,通过建立所提方法与核心向量机对偶形式的等价关系实现大规模分类。人工数据集和标准数据集上的比较实验验证了该方法的有效性。  相似文献   

11.
为了提高AdaBoost集成学习算法的数据分类性能,提出基于合群度-隶属度噪声检测及动态特征选择的改进AdaBoost算法. 综合考虑待检测样本与邻居样本的相似度及与不同类别样本集的隶属关系,引入合群度和隶属度的概念,提出新的噪声检测方法. 在此基础上,为了更好地选择那些能够有效区分错分样本的特征,在传统过滤器特征选择方法的基础上提出通用的结合样本权重的动态特征选择方法,以提高AdaBoost算法针对错分样本的分类能力. 以支持向量机作为弱分类器,在8个典型数据集上分别从噪声检测、特征选择及现有方法比较3个方面进行实验. 结果表明,所提算法充分考虑了噪声样本和样本权重对AdaBoost分类结果的影响,相对于传统算法在分类性能上获得显著提升.  相似文献   

12.
在多标签新闻分类问题中,针对传统分类器链算法难以确定标签依赖顺序、集成模型运行效率低和无法应用复杂模型作为基分类器的问题,提出基于深度神经网络的双向分类器链算法. 该方法利用正向分类器链获取每个标签和前面所有标签的依赖关系,引入逆向分类器链,从正向链最后一个基分类器的输出开始反向学习每个标签和所有其他标签的相关性. 为了提取非线性标签相关性和提高预测性能,使用深度神经网络作为基分类器. 结合2条分类器链的均方误差,使用随机梯度下降算法对目标函数进行有效优化. 在多标签新闻分类数据集RCV1-v2上,将所提算法与当前主流的分类器链算法和其他多标签分类算法进行对比和分析. 实验结果表明,利用深度双向分类器链算法能够有效提升预测性能.  相似文献   

13.
由于运动想象脑电信号的信噪比较低,特征提取和特征选择比较困难,无法获得较高的分类准确率。针对上述问题,该文提取了时域、频域和空间域3个观察面的特征,并采用粒子群优化算法结合随机森林分类器来进行特征筛选。具体过程为,首先根据R2图来对信号进行带通滤波;其次,使用小波软阈值和得分共空间模式算法进行去噪和通道筛选;然后,通过3种算法提取时频域和空间域特征,待特征融合之后使用基于随机森林分类器的评价指标作为PSO的适应度函数,进行特征选择;最后,运用3种分类器以及集成分类器来验证效果。实验结果显示,通过特征融合以及特征选择可以去除冗余信息,保留有效信息,最终的分类正确率达到98.3%,为该技术在医疗康复等领域应用提供了新的方法。  相似文献   

14.
为了降低特征冗余,提高移动用户行为识别的准确率,提出一种基于蚁群算法的移动用户行为识别加速度信号特征优选方法。首先对样本数据进行预处理,根据特征对不同行为的分类敏感度进行初次优选,降低特征搜索空间的维度;然后利用蚁群算法结合神经网络分类器,以特征的分类准确度为评价准则对特征集合进行了二次优选。实验结果表明,该方法优选出的特征集具有较好的识别性能。  相似文献   

15.
针对PCA方法所提取的特征分类效果较差,而LDA方法通常不能直接应用于图像特征提取的问题,提出了一种基于PC-LDA的交通标志形状特征识别方法.通过对交通标志图像进行归一化和二值化处理,得到交通标志形状特征.将PCA方法与LDA方法相结合用于交通标志二值图像特征提取,可以得到既有最佳描述性又有最佳分类效果的PC-LDA特征子空间.利用标准交通标志图像数据库进行验证,并采用最小距离分类器对所提取的特征进行识别,结果表明,该方法能够快速有效地进行维数约减,提高了交通标志识别率.  相似文献   

16.
针对信息增益算法只能考察特征对整个系统的贡献、忽略特征对单个类别的信息贡献的问题,提出改进信息增益算法,通过引入权重系数调整对分类有重要价值的特征的信息增益值,以更好地考虑一个词在类别间的分布不均匀性. 针对传统专利自动分类中训练集标注瓶颈问题,提出基于改进三体训练算法的半监督分类方法,通过追踪每次更新后的训练集样本类别分布来动态改变3个分类器对同一未标记样本类别的预测概率阈值,从而在降低噪音数据影响的同时实现对未标记训练样本的充分利用. 实验结果表明,本研究所提出的分类方法在有标记训练样本较少的情况下,可以取得较好的自动分类效果,并且适当增大未标记样本数据可以增强分类器的泛化能力.  相似文献   

17.
肿瘤基因选择方法LLE Score   总被引:1,自引:0,他引:1  
针对处理肿瘤基因表达数据特征选择问题,提出了一种特征选择方法 LLE Score.该方法是典型的过滤器类型特征选择方法,在样本类别信息的基础上,LLE Score针对特征向量的局部邻域保存能力进行评价,并且根据评价结果进行特征的选取,以此达到良好的特征选择效果.在实验部分对肿瘤数据集进行特征选择,并采用支持向量机分类器计算分类准确率.通过分类准确率说明了该方法的有效性.  相似文献   

18.
基于冗余分析的特征选择算法   总被引:1,自引:0,他引:1  
针对冗余特征判定难题,分析了特征和特征之间的相关性以及特征和目标值之间相关性的联系,给出了判定冗余特征的准则,在此基础上给出了近似冗余特征的定义,并提出了一种基于冗余分析的特征选择算法.算法分2步去除无关特征和冗余特征.实验结果表明,所提出的特征选择算法能有效降低特征维数,提高预测准确率.  相似文献   

19.
针对脑功能连接数据维度过高、冗余特征过多影响神经网络分类准确率的问题,提出一种基于显著稀疏强关联的脑功能连接分类方法. 该方法利用显著特征稀疏模块对原始特征进行筛选增强;采用稀疏强关联特征上下文融合模块对不同感受野内的显著特征信息进行聚合;使用全连接神经网络进行分类预测. 在ABIDE以及ADHD-200数据集上的实验结果表明,所提方法相较于现有的脑功能连接分类算法在准确率上分别提升了10.41%和12.50%. 重要特征的可视化结果表明所提方法能准确定位与疾病相关的脑区,具有一定实际应用价值.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号