首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
人脸识别一般都要先对人脸特征做维数约简,再做识别。有些传统的维数约简算法对训练样本的数量有一定的要求,比如对分类比较有效的LDA算法。而现实应用中,数据库往往只能为每个人脸对象提供数量非常有限的图片,甚至是单样本。提出一种基于均匀LBP(Local Binary Pattern)算子和稀疏编码的人脸识别方法,使用少量关键特征代替维数约简过程,解决训练样本稀少的问题。在Stirling人脸库上进行测试,获得较高的识别率和鲁棒性,证实了算法的有效性。  相似文献   

2.
属性约简能有效地去除不必要属性,提高分类器的性能。模糊粗糙集是处理不确定信息的重要范式,能有效地应用于属性约简。在模糊粗糙集中,样本分布的不确定性会影响对象的近似集,进而影响有效属性约简的获取。为有效地定义近似集,文中提出了基于距离比值尺度的模糊粗糙集,该模型引入了基于距离比值尺度的样本集的定义,通过对距离比值尺度的控制,避免了样本分布不确定性对近似集的影响;给出了该模型的基本性质,定义了新的依赖度函数,进而设计了属性约简算法;以SVM,NaiveBayes和J48作为测试分类器,在UCI数据集上评测所提算法的性能。实验结果表明,所提出的属性约简算法能够有效获取约简并提高分类的精度。  相似文献   

3.
马超红  翁小清 《计算机科学》2018,45(2):291-296, 317
在时间序列数据挖掘领域,时间序列的早期分类越来越受到人们的重视,由于时间序列的长度(也称为维数)较大,在早期分类的实际应用中选择合适的维数约简方法非常重要,因此提出一种基于分段聚合近似(PAA)的时间序列早期分类方法。首先运用PAA对时间序列样本进行维数约简,然后在低维空间对样本进行早期分类,在43个时间序列数据集上的实验结果表明, 所提方法 在准确率、早期性、可靠性等方面优于已有方法。  相似文献   

4.
针对神经网络分类器训练时间长、泛化能力差的问题,提出了一种基于动态数据约简的神经网络分类器训练方法(DDR)。该训练方法在训练过程中赋给每个训练样本一个权重值作为样本的重要性度量,依据每次网络迭代训练样本的分类错误率动态更新每个训练样本的权重值,之后依据样本的权重值来约简训练样本,从而增加易错分类的边界样本比重,减少冗余核样本的作用。数值实验表明,基于权重的动态数据约简神经网络训练方法不仅大幅缩短了网络的训练时间,而且还能够显著提升网络的分类泛化能力。  相似文献   

5.
用于文本分类的改进KNN算法   总被引:1,自引:1,他引:1       下载免费PDF全文
采用灵敏度方法对距离公式中文本特征的权重进行修正;提出一种基于CURE算法和Tabu算法的训练样本库的裁减方法,采用CURE聚类算法获得每个聚类的代表样本组成新的训练样本集合,然后用Tabu算法对此样本集合进行进一步维护(添加或删除样本),添加样本时只考虑增加不同类交界处的样本,添加或删除样本以分类精度最高、与原始训练样本库距离最近为原则。  相似文献   

6.
黄鸿  唐玉枭  段宇乐 《自动化学报》2022,48(10):2496-2507
大量维数约简(Dimensionality reducion, DR)方法表明保持数据间稀疏特性的同时,确保几何结构的保持能更有效提取出具有鉴别性的特征,为此本文提出一种联合局部几何近邻结构和局部稀疏流形的维数约简方法.该方法首先通过局部线性嵌入方法重构每个样本以保持数据的局部线性关系,同时计算样本邻域内的局部稀疏流形结构,在此基础上通过图嵌入框架保持数据的局部几何近邻结构和稀疏结构,最后在低维嵌入空间中使类内数据尽可能聚集,提取低维鉴别特征,从而提升地物分类性能.在Indian Pines和PaviaU高光谱数据集上的实验结果表明,本文方法相较于传统维数约简方法能明显提高地物的分类性能,总体分类可达到83.02%和91.20%,有利于实际应用.  相似文献   

7.
半监督维数约简是指借助于辅助信息与大量无标记样本信息从高维数据空间找到一个最优低维判别空间,便于后续的分类或聚类操作,它被看作是理解基因序列、文本与人脸图像等高维数据的有效方法。提出一个基于成对约束的半监督维数约简一般框架(SSPC)。该方法首先通过使用成对约束和无标号样本的内在几何结构学习一个判别邻接矩阵;其次,新方法应用学到的投影将原来高维空间中的数据映射到低维空间中,以至于聚类内的样本之间距离变得更加紧凑,而不同聚类间的样本之间距离变得尽可能得远。所提出的算法不仅能找到一个最佳的线性判别子空间,还可以揭示流形数据的非线性结构。在一些真实数据集上的实验结果表明,新方法的性能优于当前主流基于成对约束的维数约简算法的性能。  相似文献   

8.
王坚强  王丹丹 《控制与决策》2014,29(10):1823-1827
针对准则值为扩展灰数形式的风险型多准则决策问题,提出一种基于扩展灰数Hausdorff距离的随机多准则决策方法.首先定义了离散型扩展灰色随机变量及期望值和标准差,并在Hausdorff距离的基础上提出了扩展灰数的Hausdorff距离公式;然后计算每个方案在各准则下的期望值,得到期望值决策矩阵;再根据传统TOPSIS方法的思想,提出一种基于TOPSIS的灰色随机多准则决策方法.最后,通过实例验证了所提出方法的合理性和可行性.  相似文献   

9.
针对人耳识别中无法避免的小样本问题,提出了基于Gabor特征和改进LDA(ILDA)的识别算法。该算法首先提取人耳局部Gabor特征,然后重新定义Fisher准则和类内分散度矩阵,再将高维空间映射到低维后寻找最优投影方向,最后利用训练样本与测试样本特征投影值的欧氏距离进行分类识别。与传统方法相比,新算法能有效解决人耳识别中的小样本问题,获得较高的识别准确率。  相似文献   

10.
在多标记学习与分类中,现有邻域粗糙集特征选择算法若将样本的分类间隔作为邻域半径,则会出现分类间隔过大导致分类无意义、样本距离过大容易造成异类样本和同类样本失效,以及无法处理弱标记数据等情况.为解决这些问题,提出一种基于多标记邻域粗糙集和多标记Relief的弱标记特征选择方法.首先,引入异类样本数和同类样本数来改进分类间...  相似文献   

11.
最小距离分类法和最近邻分类法是最简单、快速、有效的分类方法,但对噪声较敏感,对于训练样本很少或训练样本偏离类中心较远时,分类效果较差。针对这一问题,提出了基于均值更新(MU)的分类模型,通过不断扩大训练样本并更新均值中心来改善对测试数据的分类效果;并在此基础上提出了基于均值更新的最小距离(MU-MD)分类模型,利用MU的分类结果重新计算各类的均值,然后采用最小距离法对所有测试样本重新进行划分,以确定最终的类别归属,这样可以部分纠正MU分类过程中的错分,进一步提高分类效果。  相似文献   

12.
Systems that produce ranked lists of results are abundant. For instance, Web search engines return ranked lists of Web pages. There has been work on distance measure for list permutations, like Kendall tau and Spearman's footrule, as well as extensions to handle top-k lists, which are more common in practice. In addition to ranking whole objects (e.g., Web pages), there is an increasing number of systems that provide keyword search on XML or other semistructured data, and produce ranked lists of XML sub-trees. Unfortunately, previous distance measures are not suitable for ranked lists of sub-trees since they do not account for the possible overlap between the returned sub-trees. That is, two sub-trees differing by a single node would be considered separate objects. In this paper, we present the first distance measures for ranked lists of sub-trees, and show under what conditions these measures are metrics. Furthermore, we present algorithms to efficiently compute these distance measures. Finally, we evaluate and compare the proposed measures on real data using three popular XML keyword proximity search systems.  相似文献   

13.
杨浩  王宇  张中原 《计算机应用》2019,39(7):1883-1887
为了解决不均衡数据集的分类问题和一般的代价敏感学习算法无法扩展到多分类情况的问题,提出了一种基于K最近邻(KNN)样本平均距离的代价敏感算法的集成方法。首先,根据最大化最小间隔的思想提出一种降低决策边界样本密度的重采样方法;接着,采用每类样本的平均距离作为分类结果的判断依据,并提出一种符合贝叶斯决策理论的学习算法,使得改进后的算法具备代价敏感性;最后,对改进后的代价敏感算法按K值进行集成,以代价最小为原则,调整各基学习器的权重,得到一个以总体误分代价最低为目标的代价敏感AdaBoost算法。实验结果表明,与传统的KNN算法相比,改进后的算法在平均误分代价上下降了31.4个百分点,并且代价敏感性能更好。  相似文献   

14.
In this paper, we present a two-level statistical model for characterizing the stochastic and specific nature of trees. At the low level, we define plantons, which are a group of similar organs, to depict tree organ details statistically. At the high level, a set of transitions between plantons is provided to describe the stochastic distribution of organs.Based on such a tree model, we propose a novel tree modeling approach, synthesizing trees by plantons, which are extracted from tree samples. All tree samples are captured from the real world. We have designed a maximum likelihood estimation algorithm to acquire the two-level statistical tree model from single samples or multi- samples. Experimental results show that our new model is capable of synthesizing new trees with similar, yet visually different shapes. Electronic supplementary material Supplementary material is available in the online version of this article at and is accessible for authorized users.  相似文献   

15.
Given an edge-weighted tree T=(V(T),E(T)) and its subtree T, for any vV(T), the distance d(v,T) is defined as the minimum weighted distance from v to any vertex in T. The distance d(T,T) is defined as the sum of all distances of the form d(v,T) where vV(T). We give an algorithm to find a T that minimizes d(T,T) and for all wV(T), the degree degT(w) of w is not more than a prespecified bound db(w)(0?db(w)?degT(w)) at w. The worst-case running time of our algorithm is in O(|V(T)|).  相似文献   

16.
提出了一种基于聚类和密度的KNN分类器训练样本约减方法。使用KNN分类器进行文本分类的时侯,由于训练样本在类别内分布的不均匀,会造成分类准确性的下降,而且相似度计算量非常大。新方法根据训练样本的密度采用聚类的方法,约减了一定数量的“噪声”样本。实验表明,使用该方法能同时提高KNN分类器的准确率和效率。  相似文献   

17.
基于动态聚类及样本筛选的人脸识别   总被引:1,自引:0,他引:1  
为了综合体现训练样本的共性和个性,应用动态聚类技术,通过对于训练样本集中的同类别样本进行动态聚类,形成若干样本子集,并将这些子集的类心作为代表用于距离计算,避免了采用样本全集类心作为代表所导致的样本个性削弱,也比采用所有训练样本作为代表样本减少了存储空间和计算时间。此外,通过对于训练样本进行筛选,去除了孤立样本的影响,避免了“过拟合”现象。实验结果证明了算法的有效性。  相似文献   

18.
基于小样本学习的垃圾邮件过滤方法   总被引:1,自引:0,他引:1       下载免费PDF全文
针对客户端垃圾邮件过滤器难以获取足够训练样本的问题,提出一种基于小样本学习的垃圾邮件过滤方法,利用容易获取的未标记样本提高垃圾邮件过滤的性能。该方法使用已标记的小样本邮件实例集训练一个初始Na?ve Bayes分类器,以此标注未标记邮件,再使用所有数据训练新的分类器,利用EM算法进行迭代直至收敛。实验结果证明,当给定5个~20个已标记小样本训练邮件时,该方法可有效提高垃圾邮件过滤性能。  相似文献   

19.
基于边界距离场的管腔中心路径自动提取算法   总被引:1,自引:0,他引:1  
首先计算三维空腔目标的精确边界距离场,然后建立基于该距离场的代价最大生成树,最后从生成树中提取中心路径.实验结果表明,精确的边界距离场使得提取的中心路径更加精确,而快速算法的应用提高了该算法的效率,获得的结果可直接用作虚拟内窥镜的漫游路径.  相似文献   

20.
基于样图的纹理合成技术研究   总被引:3,自引:0,他引:3  
基于样图的纹理合成方法是继纹理映射、过程纹理合成方法后发展起来的一种纹理技术,用于解决传统方法中出现的缝隙、扭曲、变形和参数调整等问题。在大规模场景的生成以及真实感图形绘制和非真实感绘制、计算机动画等方面具有广泛的应用前景;同时对图像编辑、数据压缩、网络数据的快速传输也有一定的指导意义。该文首先简要回顾了纹理技术的发展历程,总结出基于样图的纹理合成技术的基本原理,从基于Markov模型、侧重逼真显示、任意曲面等几个方面,对基于样图的纹理合成技术进行了较全面的总结和分析,对该领域未来的研究和应用前景做出了有益的探讨。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号