排序方式: 共有25条查询结果,搜索用时 31 毫秒
1.
恐怖主义被称为现代人类社会之癌,是世界各国政府和人民面临着的重大的挑战,应该引起全人类的重视。在使用全球恐怖主义数据库中的数据对恐怖主义活动进行研究时,从高维数据中提取关键的特征,是反恐研究中的重点和难点。针对全球恐怖主义数据库中特征的高维性、冗余性和数据不完整性的特点,分别采用最小冗余最大相关算法(mRMR)、基于支持向量机的递归删除算法(SVM-RFE)和基于随机森林的特征选择算法进行特征筛选与提取。利用K-近邻(KNN)分类器其对上述特征选择方法进行降维结果分析和分类结果比较。实验结果表明,特征选择算法不仅能提高分类性能还能提高分类效率,并且基于支持向量机的递归删除算法(SVM-RFE)选择的特征子集在预测恐怖主义活动时准确率更高。 相似文献
2.
3.
针对滚动轴承原始振动信号重要特征信息被较强背景噪声淹没以及提取的时域特征冗余度较高、相关性较强的缺点,提出一种基于最大相关-最小冗余(max-relevance and min-redundancy, mRMR)特征筛选和随机森林的滚动轴承故障诊断研究方法。首先将原始信号进行自适应噪声完整集成经验模态分解(CEEMDAN)得到一系列固有模态分量(IMFs),分析IMF并去掉高频噪声和一部分虚假分量,再将信号进行重构并提取其时域特征,通过mRMR去除冗余性和相关性较高的特征向量,使筛选出的特征子集与标签有最大的依赖性,最后将该特征子集输入到随机森林分类器进行分类。实验表明,mRMR具有优良的特征搜索策略,重要特征均靠前得到选取,仅需3个特征便能达到较高的分类准确率,效率高于其余特征选择算法。 相似文献
4.
分类问题普遍存在于现代工业生产中。在进行分类任务之前,利用特征选择筛选有用的信息,能够有效地提高分类效率和分类精度。最小冗余最大相关算法(mRMR)考虑最大化特征与类别的相关性和最小化特征之间的冗余性,能够有效地选择特征子集;但该算法存在中后期特征重要度偏差大以及无法直接给出特征子集的问题。针对该问题,文中提出了结合邻域粗糙集差别矩阵和mRMR原理的特征选择算法。根据最大相关性和最小冗余性原则,利用邻域熵和邻域互信息定义了特征的重要度,以更好地处理混合数据类型。基于差别矩阵定义了动态差别集,利用差别集的动态演化有效去除冗余属性,缩小搜索范围,优化特征子集,并根据差别矩阵判定迭代截止条件。实验选取SVM,J48,KNN和MLP作为分类器来评价该特征选择算法的性能。在公共数据集上的实验结果表明,与已有算法相比,所提算法的平均分类精度提升了2%左右,同时在特征较多的数据集上能够有效地缩短特征选择时间。所提算法继承了差别矩阵和mRMR的优点,能够有效地处理特征选择问题。 相似文献
5.
为了解决基因数据集的基因选择难题,提出一种基于K-S检验与最小冗余最大相关(Minimum Redundancy-Maximum Relevance,mRMR)原则的基因选择算法。该算法先采用K-S检验选择出具有一定区分能力的基因,然后对选择到的基因进行mRMR判断,保留与类别高度相关而其间相关性较小的基因构成最终被选基因子集。以SVM为分类器,以F1_measure、分类准确率和AUC为评价指标对本文算法选择的基因子集进行评估,并将本文算法与K-S检验、mRMR,以及经典的RELIEF和FAST算法进行比较。5个经典基因数据集上的平均实验结果揭示:本文算法的运行时间远低于mRMR算法,且其各项评价指标值优于其他比较算法。因此,本文提出的K-S检验与mRMR结合的基因选择算法能选择到非常有效的基因子集。 相似文献
6.
提出一种基于融合特征选择与鲁棒概率协同表示分类器(Robust Probabilistic Collaborative Representation Based Classifier, R-ProCRC)的癫痫发作自动检测算法。首先,对原始脑电(Electroencephalography, EEG)信号进行经验模态分解(Empirical Mode Decomposition, EMD)以及离散小波变换(Discrete Wavelet Transform, DWT);然后,对分解得到的各子波分别进行多种特征融合提取,并采用最大相关-最小冗余特征选择算法进行融合特征选择;最后,用R-ProCRC对选择后的数据特征进行检测。在Bonn数据集上采用十折交叉验证评估效果,取得较好的识别效果。仿真结果表明,提出算法的准确性、灵敏度和特异性分别达到99.70%,99.74%和99.66%,相比EMD算法和DWT算法,有显著提高。 相似文献
7.
针对目前集成电路测试复杂度的不断增加,导致测试成本不断攀升的问题,提出一种可靠而有效的测试集优化方法。通过k均值(K-means)聚类对原始测试集中的特征进行聚类筛选,然后采用改进的mRMR算法,分段式引入特征之间冗余性权重因子,用以权衡特征相关性和冗余性的度量,同时插入了SVM交叉验证,强化了测试模式选择的准确性。在保证故障覆盖率基本不变的情况下,达到减少原始测试集维数的目的。对ISCAS89电路实验表明,该文方法将原始测试集的测试模式进行大量的精简,既保证测试质量,也极大地优化了测试集,进行冗余消除和排序后的测试流程缩短了40.43%的测试时间,提升了测试效率,降低了测试成本。 相似文献
8.
近年溢油事故频发,海洋污染日益严重。利用合成孔径雷达(SAR)卫星可以有效跟踪由海上溢油事故导致的油膜扩展情况。利用最大冗余最小相关-支持向量机(mRMR_SVM)算法进行SAR图像溢油识别,为溢油事故决策支持提供重要前提。首先采用mRMR提取最优特征向量集,对输入值进行降维; 然后采用SVM算法解决油膜图像分类问题,同时选择径向基函数(RBF)为核函数;使用训练集训练该模型,调整模型参数;以测试集特征向量作为输入,利用训练好的模型进行溢油识别。实验结果表明,mRMR_SVM模型对SAR图像的油膜和类油膜识别有效,准确率为96.875%. 相似文献
9.
基于learning-to-rank技术构建频谱错误定位模型,从而实现高效的程序错误定位是当前的研究热点.然而,针对不同的程序和错误类型,如何生成有效的程序频谱特征集来训练错误定位模型,成为了极具挑战的问题.针对该问题,应用mRMR算法生成程序频谱特征集,提出一种learning-to-rank的错误定位新方法.该方法应用基因编程自动生成备选可疑度公式集,并利用mRMR算法从中选取一组公式子集,该子集中的可疑度公式具有与程序错误高相关且彼此之间低相关的特性.利用此可疑度公式子集结合程序频谱计算特征值输入机器学习算法,从而构造错误定位模型.实验结果表明,新方法不仅能够提高基于learning-to-rank错误定位的效率,也优于Naish1、Tarantula等传统SBFL方法. 相似文献
10.
在构建选择性集成分类器时,寻找分类准确率高且差异性大的最优分类器子集至关重要.为平衡集成子集中基分类器的准确性和多样性,提出了一种基于改进最大相关最小冗余的选择性集成分类器(ImRMRSEC).首先,将基分类器对验证集的预测结果视为一个个"特征",把特征选择的思想扩展到集成分类器的约简问题中,基于最大相关最小冗余准则寻... 相似文献