首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 296 毫秒
1.
为解决支持向量机(SVM)在处理无标签数据多类分类上的难题,提出了一种基于支持向量数据描述(SVDD)的无标签数据多类分类算法。该方法只需要建立一个分类模型就可以实现多类聚类分类。首先采用主成分分析作数据预处理,提取输入数据的统计特征值,得到主成分特征指标输入到SVDD分类器进行多类聚类分类。以珠三角地区物流中心城市分类评价为研究对象,实证结果表明,采用主成分分析降低了数据维度,有效浓缩了评估信息,SVDD分类器很好地区分了各中心城市,实现了多类分类的目的。  相似文献   

2.
董吉文  赵磊  张亮 《微机发展》2013,(7):141-143,170
人脸识别算法是一个特征提取和分类器设计的过程。针对人脸识别中的遮挡问题,提出一种基于核主成分分析(KPCA)和协同表示(CRC)相结合的人脸识别算法。提取特征时,利用KPCA提取人脸图像中利于判决的非线性结构特征,使得样本在保留了最有效判别信息的同时降低了特征维数。设计分类器时,考虑到样本之间的协同性,采用综合考虑样本之间信息的协同表示分类器进行分类识别。实验结果证明,该算法获得了很好的识别效果,效率也得到了提高。  相似文献   

3.
王辉 《微机发展》2006,16(8):24-26
文中利用主成分分析提取图像的特征信息,然后将此特征数据作为分类器的输入数据。文中采用的分类器———支持向量机是一种能在训练样本数很少的情况下达到很好分类推广能力的学习算法。再利用二叉树判别策略来对多类人脸图像进行了识别,实验取得了较好的效果。  相似文献   

4.
人脸识别算法是一个特征提取和分类器设计的过程.针对人脸识别中的遮挡问题,提出一种基于核主成分分析(KPCA)和协同表示(CRC)相结合的人脸识别算法.提取特征时,利用KPCA提取人脸图像中利于判决的非线性结构特征,使得样本在保留了最有效判别信息的同时降低了特征维数.设计分类器时,考虑到样本之间的协同性,采用综合考虑样本之间信息的协同表示分类器进行分类识别.实验结果证明,该算法获得了很好的识别效果,效率也得到了提高.  相似文献   

5.
主成分分析及支持向量机在人脸识别中的应用   总被引:2,自引:2,他引:2  
文中利用主成分分析提取图像的特征信息,然后将此特征数据作为分类器的输人数据。文中采用的分类器——支持向量机是一种能在训练样本数很少的情况下达到很好分类推广能力的学习算法。再利用二叉树判别策略来对多类人脸图像进行了识别,实验取得了较好的效果。  相似文献   

6.
本文提出了营销风险预警指标体系设计方法,给出了应用主成分分析法将原始风险预警指标体系浓缩为主成分指标体系的算法,设计了基于信息扩散理论的警度信号识别分类器。该分类器将主成分指标信息扩散到风险所有可能发生点上,其输入是浓缩后的主成分指标数据、而输出是期望的警度信号向量。基于该分类器,提出其虚警和误警概率的计算方法。由于主成分分析法的强浓缩性,因此本分类器具有处理高维预警指标体系的能力。  相似文献   

7.
基于互信息的主成分分析特征选择算法   总被引:3,自引:0,他引:3  
主成分分析是一种常用的特征选择算法,经典方法是计算各个特征之间的相关,但是相关无法评估变量间的非线性关系.互信息可用于衡量两个变量间相互依赖的强弱程度,且不局限于线性相关,鉴于此,提出一种基于互信息的主成分分析特征选择算法.该算法计算特征间的互信息,以互信息矩阵的特征值作为评价准则确定主成分的个数,并衡量主成分分析特征选择的效果.通过实例对所提出方法和传统主成分分析方法进行比较,并以神经网络为分类器分析分类效果.  相似文献   

8.
针对主成分分析算法没有很好地利用数据的类别信息,且最大主成分方向容易导致各类数据重叠的问题,提出一种融合各类最小主成分子空间的特征变换方法.首先将各类数据分别进行主成分分析,由各类最小主成分方向张成各类投影子空间;然后将原始数据在各类子空间投影后的最小主成分子空间进行融合,构成新的特征空间;最后使用KE E L公共数据集对该方法进行测试.结果表明,与其他特征变换方法相比,该方法能够构造出更加利于分类的特征空间,有助于提升分类器的分类精度.  相似文献   

9.
模式识别中的特征提取研究   总被引:1,自引:1,他引:0  
特征提取是模式识别中的关键技术之一,本文提出了一种基于改进ReliefF算法的主成分特征提取方法,通过该方法进行主特征特征提取可以有效降维,大大减轻了后续的分类器的工作量,同时也有助于提高分类器的分类精度.  相似文献   

10.
冯庆华  王鑫  杜恺  王峰  孙军  陈景川 《测控技术》2015,34(7):128-131
针对认知网络中各低信噪比环境下主用户信号检测率偏低的问题,提出一种基于主成分分析和主动学习AdaBoost的主用户信号频谱感知算法.该算法首先采用主成分分析算法对信号特征参数进行提取,获得信号的主成分,之后利用主动学习算法通过多次迭代抽样,获取有利于提高分类性能的样本,并对AdaBoost分类器进行训练,最后利用训练完成的AdaBoost分类器对待测信号进行分类检测.仿真实验表明,在各低信噪比情况下与ANN和MME算法相比较,所提算法具有较高的分类感知性能,有效地实现了对主用户信号的频谱感知.  相似文献   

11.
针对高维度小样本数据在特征选择时出现的维数灾难和过拟合的问题,提出一种混合Filter模式与Wrapper模式的特征选择方法(ReFS-AGA)。该方法结合ReliefF算法和归一化互信息,评估特征的相关性并快速筛选重要特征;采用改进的自适应遗传算法,引入最优策略平衡特征多样性,同时以最小化特征数和最大化分类精度为目标,选择特征数作为调节项设计新的评价函数,在迭代进化过程中高效获得最优特征子集。在基因表达数据上利用不同分类算法对简化后的特征子集分类识别,实验结果表明,该方法有效消除了不相关特征,提高了特征选择的效率,与ReliefF算法和二阶段特征选择算法mRMR-GA相比,在取得最小特征子集维度的同时平均分类准确率分别提高了11.18个百分点和4.04个百分点。  相似文献   

12.
针对特征选择中存在数据缺乏类别信息的问题,提出一种新型的基于改进ReliefF的无监督特征选择方法UFS-IR.由于ReliefF类算法存在小类样本抽样概率低、无法删除冗余特征的缺陷,该方法以DBSCAN聚类算法指导分类,通过改进抽样策略,使用调整的余弦相似度度量特征间的相关性作为去冗余的凭据.实验表明UFS-IR可以有效缩减数据维度的同时保证特征子集的最大相关最小冗余性,具有很好的性能.  相似文献   

13.
在图像标注、疾病诊断等实际分类任务中,数据标记空间的类别通常存在着层次化结构关系,且伴随着特征的高维性.许多层次特征选择算法因不同的实际任务需求而提出,但这些已有的特征选择算法忽略了特征空间的未知性和不确定性.针对上述问题,提出一种基于ReliefF的面向层次分类学习的在线流特征选择算法OH_ReliefF.首先将类别...  相似文献   

14.
一种基于PCA和ReliefF的特征选择方法   总被引:4,自引:0,他引:4       下载免费PDF全文
如何减少样本的训练测试时间、提高分类精度是有效特征选择方法研究的重要方面。提出了一种结合PCA和ReliefF的特征选择算法。该算法选择出了最具有代表性的特征,构成有效特征子集,实现了特征降维。同时,较PCA-GA方法,该算法具有简单、快速等优点。利用标准数据集进行的实验结果表明,文中算法是可行的、有效的,为模式识别的信息特征压缩提供了一种新的研究方法。  相似文献   

15.
事件抽取是自动内容抽取(Automatic Content Extraction,ACE)会议评测的任务之一,事件要素识别是事件抽取的一个子任务。分析了事件抽取和事件要素识别的研究现状,提出了一种基于特征加权的事件要素识别算法(Feature Weighting Based Event Argument Identification,FWEAI)。该算法首先对分类算法中的ReliefF特征选择算法进行改进,将其应用于聚类算法中。改进的ReliefF算法(FWA)根据各个特征对聚类的不同贡献分配不同的权值,然后采用KMeans算法对事件要素进行聚类。实验结果表明,FWEAI算法可以提高事件要素识别的准确率。  相似文献   

16.
针对高维小样本的DNA微阵列数据多分类问题,提出一种基于ReliefF和蚁群算法的特征基因选择方法(ReliefF and Ant Colony Optimization, ReFACO)。该方法首先采用ReliefF算法评估特征权重,根据阈值筛选出无关基因;然后引入改进的蚁群算法,在迭代改进的过程中寻找最优基因子集;最后利用经典分类算法对维数约简后的数据分类识别。经实验证明,该方法可以有效地剔除无关和冗余基因,并利用较少特征基因达到较高多分类效果。  相似文献   

17.
针对蜜罐中数据分析系统的薄弱性,提出了基于PCA和改进的ReliefF方法的告警日志分析系统。通过主成分分析,去除特征之间的冗余性,能够有效降低算法的复杂性,再利用改进的ReliefF算法,选择出最能代表样本的特征,构成有效特征子集,实现特征的降维。该方法能够在保证较高分类精度的同时,显著提高分类速度,并在一定程度上实现了数据分析的智能化和自动化,实验结果表明了其正确性。  相似文献   

18.
针对网络数据特征维度高、现有的入侵检测方法准确率低的问题,该文提出了一种基于主成分分析(PCA)和循环神经网络(RNN)的入侵检测方法PCA-RNN。该方法先对网络数据进行预处理,通过主成分分析法对数据进行特征降维和降噪,找出含有最大信息的主成分特征子集,然后对处理后的数据使用循环神经网络进行分类训练。实验使用基于Python的TensorFlow平台,并采用NSL-KDD作为实验数据集。实验结果表明,与常用的基于机器学习和深度学习方法的入侵检测技术相比较,该文提出的入侵检测方法可有效地提高检测的准确性。  相似文献   

19.
特征选择是高维数据降维的一种关键技术。传统数据降维技术如PCA,只是转化数据的表达形式,不能表达数据的相关程度。近年来提出信息度量方法,使用评价函数表示数据的不确定性程度,虽然能较好地体现数据之间的相关程度,但并没有充分考虑选取的特征对整个样本空间的影响。针对传统方法的不足,提出一种基于贝叶斯和谐度特征选择算法。贝叶斯和谐度来自贝叶斯阴阳和谐学习理论,可以估计整个数据空间的联合概率分布,选取的特征能够较好地反应整个样本空间的变化。根据和谐度的变化来度量类之间的相似度从而得到冗余度较低的特征组合。与传统方法如ReliefF、FCBF等比较后发现,在取同样特征个数的情况下,和谐度度量得到的特征组合对数据分类更有效。  相似文献   

20.
随机森林(random forest,RF)算法虽应用广泛且分类准确度很高,但在面对特征维度高且不平衡的数据时,算法分类性能被严重削弱。高维数据通常包含大量的无关和冗余的特征,针对这个问题,结合权重排序和递归特征筛选的思想提出了一种改进的随机森林算法RW_RF(ReliefF&wrapper random forest)。首先引用ReliefF算法对数据集的所有特征按正负类分类能力赋予不同的权值,再递归地删除冗余的低权值特征,得到分类性能最佳的特征子集来构造随机森林;同时改进ReliefF的抽样方式,以减轻不平衡数据对分类模型的影响。实验结果显示,在特征数目很多的数据集中,改进算法的各评价指标均高于原算法,证明提出的RW_RF算法有效精简了特征子集,减轻了冗余特征对模型分类精度的影响,同时也证明了改进算法对处理不平衡数据起到了一定的效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号