首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 187 毫秒
1.
胡正平  路亮  许成谦 《电子学报》2012,40(1):134-140
 已有单类分类算法通常采用欧氏测度描述样本间相似关系,然而欧氏测度有时难以较好地反映一些数据集样本的内在分布结构,为此提出一种用于改善单类分类器描述性能的高维空间单类数据距离测度学习算法,与已有距离测度学习算法相比,该算法只需提供目标类数据,通过引入样本先验分布正则化项和L1范数惩罚的距离测度稀疏性约束,能有效解决高维空间小样本情况下的单类数据距离测度学习问题,并通过采用分块协调下降算法高效的解决距离测度学习的优化问题.学习得到的距离测度能容易地嵌入到单类分类器中,仿真实验结果表明采用学习得到的距离测度能有效改善单类分类器的描述性能,特别能够改善覆盖分类的描述能力,从而使得单类分类器具有更强的推广能力.  相似文献   

2.
针对视频分类中普遍面临的类内离散度和类间相似性较大而制约分类性能的问题,该文提出一种基于深度度量学习的视频分类方法。该方法设计了一种深度网络,网络包含特征学习、基于深度度量学习的相似性度量,以及分类3个部分。其中相似性度量的工作原理为:首先,计算特征间的欧式距离作为样本之间的语义距离;其次,设计一个间隔分配函数,根据语义距离动态分配语义间隔;最后,根据样本语义间隔计算误差并反向传播,使网络能够学习到样本间语义距离的差异,自动聚焦于难分样本,以充分学习难分样本的特征。该网络在训练过程中采用多任务学习的方法,同时学习相似性度量和分类任务,以达到整体最优。在UCF101和HMDB51上的实验结果表明,与已有方法相比,提出的方法能有效提高视频分类精度。  相似文献   

3.
周炫余  刘娟  邵鹏  卢笑  罗飞 《电子学报》2016,44(12):3064-3072
相比于传统的基于半监督学习的指代消解方法,Laplacian SVM(Support Vector Machine)能有效的挖掘已标注样本和未标注样本的相似性和关联性,更好的推导模型的分类边界。而传统Laplacian SVM采用欧式距离度量样本之间的距离,使得异类样本之间的相似性可能过大,不利于样本的准确分类。对此,提出一种基于数据驱动学习最优测度Laplacian SVM算法以解决中文指代消解语料不足的问题。该方法通过优化样本对之间的相似性约束条件和引入Fisher判别项,增大同类样本间的相似性,并突出强判别能力的特征。此外,提出核嵌入的测度优化方法将以上线性测度优化推广到非线性空间,有利于Laplacian SVM利用核函数实现非线性分类。在ACE2005中文语料库上的测评结果表明,所提出测度优化的Laplacian SVM(包括线性和核嵌入两种形式)的方法只需少量标注样本就可以获得与经典的有监督学习模型相当甚至更好的消解性能,同时也优于其他传统的半监督学习方法。  相似文献   

4.
行人重识别的精确度主要取决于相似性度量方法和特征学习模型。现有的度量方法存在平移不变性的特点,会增加网络参数训练的难度。现有的几种特征学习模型只强调样本之间的绝对距离而忽略了正样本对和负样本对之间的相对距离,造成网络学习到的特征判别性不强。针对现有度量方法的缺点该文提出一种平移变化的距离度量方法,能够简化网络的优化并能高效度量图像之间的相似性。针对特征学习模型的不足,提出一种增大间隔的逻辑回归模型,模型通过增大正负样本对之间的相对距离,使得网络得到的特征判别性更强。实验中,在Market1501和CUHK03数据库上对所提度量方式和特征学习模型的有效性进行验证,实验结果表明,所提度量方式性能更好,其平均精确率超出马氏距离度量6.59%,且所提特征学习模型也取得了很好的性能,算法的平均精确率较现有的先进算法有显著提高。  相似文献   

5.
为了能够综合利用隐马尔可夫模型(HMMs)分类器在分类过程中能够得到的多种信息,提出一种基于距离相似性度量对HMMs后验概率进行调整的方法,将样本相似性与HMMs后验概率有机地结合起来进行识别。在分类过程中,采用距离相似性度量来描述待识别样本与模式类标准样本间的相似性,然后采用归一化距离相似性度量对后验概率进行适当调整,最后用调整后的概率进行分类。实验结果表明:与标准的HMMs识别方法相比,改进后的方法能够在计算量增加很小的情况下,较好地改善系统的识别精度;系统性能的改善效率在1.1~6.5间。  相似文献   

6.
无线频谱状态感知是实现无线频谱资源高效利用及各种用频系统和谐共存的先决条件之一。针对复杂无线传播环境下获取的频谱观测往往存在数据稀疏性、数据类别分布不稳定、标记数据严重不足的情况,该文提出基于插值和小样本学习(FSL)分类的无线频谱状态感知方法。首先,对捕获的稀疏频谱观测数据插值,构建频谱状态地图,作为频谱状态分类器的输入数据。其次,针对频谱数据类别分布不稳定、数据量严重不足的问题,基于小样本学习方法,利用嵌入模块和度量模块协同工作,以实现快速精确的频谱状态分类。具体地,利用嵌入模块将频谱数据映射到嵌入空间,提取频谱数据中的隐含特征;在度量模块的设计中,分别提出基于原型和基于样例的两种类别表示方式,通过计算待分类样本与类别之间的相似度判断待分类样本类别。最后,为了确保分类模型克服测试样本数量少导致过拟合问题,设置A-way B-shot任务训练模型。仿真结果表明,与传统机器学习方法相比,本文模型可以在低信噪比条件下进行精准分类;同时,在测试集样本数很少的情况下,或者在测试集中出现在训练集从未见到的新类时,所训练的模型也可以精准快速判别无线频谱的场景类别。  相似文献   

7.
一种基于距离相似性度量和HMMs的字符识别方法   总被引:1,自引:0,他引:1  
为了能够综合利用隐马尔可夫模型(HMMs)分类器在分类过程中能够得到的多种信息,提出一种基于距离相似性度量对HMMs后验概率进行调整的方法,将样本相似性与HMMs后验概率有机地结合起来进行识别.在分类过程中,采用距离相似性度量来描述待识别样本与模式类标准样本间的相似性,然后采用归一化距离相似性度量对后验概率进行适当调整,最后用调整后的概率进行分类.实验结果表明:与标准的HMMs识别方法相比,改进后的方法能够在计算量增加很小的情况下,较好地改善系统的识别精度;系统性能的改善效率在1.1~6.5间.  相似文献   

8.
基于数据的机器学习是研究从观测数据出发寻找规律,并利用这些规律对未来数据进行预测.该文提出一种新的分类判别方法--覆盖算法,其主要过程是利用某种覆盖规则算法寻找一些训练样本集的支撑点(代表点),在决策的时候仅需计算待分类样本与支撑覆盖点之间的距离并进行比较,与之最近的支撑点所在类别即为代分类样本的类别.而支撑点仅占全部训练样本的一部分,所以相比最近邻方法具有较小运算量和存储量的优点.另一方面,覆盖算法主要是样本之间的距离运算,不需要像SVM那样考虑核函数的选择问题,因此更适用于大数据量的自动分类问题.对正常星系和恒星两类光谱数据进行实验,结果表明,覆盖算法具有较好的鲁棒性、较高的分类正确率.  相似文献   

9.
小样本学习任务旨在仅提供少量训练样本的情况下完成对测试样本的正确分类.基于度量学习的小样本学习方法通过将样本映射到嵌入空间中,计算样本间距离得到相似性度量以预测类别,但仅对样本特征进行独立映射,而忽略了对整个任务的观察,同时在小样本场景下通过传统方法计算的原型与期望原型存在偏差,导致在查询集上泛化性较低.针对上述问题,提出了特征关系依赖网络(FRDN).特征关系依赖网络包含两个模块:首先使用关系挖掘模块充分挖掘任务中样本的类内与类间关系,将其作为自注意力值对类簇进行调整,以获得判别性更高的任务自适应嵌入空间,计算初始原型;随后使用偏差抑制模块对初始原型进行校正,得到在查询集上泛化性更高的优化原型,进一步提高模型的分类准确率.在MiniImagenet数据集上,该方法1-shot分类准确率59.17%,5-shot准确率74.11%,分别超过传统度量学习方法6.13%与2.83%;在CUB数据集上分别提升9.3%和2.74%.  相似文献   

10.
经典分类模型总是假定测试样本属于训练类之一,然而在网络安全、身份识别、医学诊断等非合作模式识别中往往存在许多非训练类例外模式,这时由于分类器缺乏拒识能力,只能给出错误判决。为此,本文构造了一种基于区分性投影结合最小L1球覆盖的可拒识双层近邻分类器。该方法针对一类分类器忽略类别间区分性描述的不足,定义一种能够表征各训练类模式细节信息的差分矢量,形成新的差分特征。在差分特征空间进行L1范数最大化主成分分析(L1-norm maximization principal component analysis, PCA-L1)构建新的区分性投影方法即差分矢量PCA-L1特征提取。然后,在投影空间对各类别分别建立最小L1球覆盖决策边界,这样对于输入的测试模式,便可做出拒识或者接受处理的判决。最后,针对接受的输入模式,再通过最近邻测试得到识别结果。在UCI数据库、MNIST手写体数据库和CMU AMP人脸表情数据库上的实验结果表明本文方法对训练类测试样本具有较高正确识别率的同时,同时能够对非训练类测试样本进行有效地拒识,在实际模式识别领域具有一定的应用价值。   相似文献   

11.
现有的面向大规模数据分类的支持向量机(support vector machine,SVM)对噪声样本敏感,针对这一问题,通过定义软性核凸包和引入pinball损失函数,提出了一种新的软性核凸包支持向量机(soft kernel convex hull support vector machine for large scale noisy datasets,SCH-SVM).SCH-SVM首先定义了软性核凸包的概念,然后选择出能代表样本在核空间几何轮廓的软性核凸包向量,再将其对应的原始空间样本作为训练样本并基于pinball损失函数来寻找两类软性核凸包之间的最大分位数距离.相关理论和实验结果亦证明了所提分类器在训练时间,抗噪能力和支持向量数上的有效性.  相似文献   

12.
对于特征类的海面小目标检测方法,现有3特征检测器通常采用凸包分类算法完成检测。在实际应用时发现,该分类算法生成的判决区域在某些情况下不能很好地反映海杂波样本集合在特征空间中的分布情况,进而对检测器性能造成一定程度的损失。相比之下,使用凹包算法生成的判决区域是由凸包内剖得到的,它能更加贴合海杂波样本的分布,因此该文将判决区域的形式由凸包转化为凹包,并在此基础之上提出一种基于3维凹包学习算法的海面小目标检测方法。同时,针对现有3维凹包算法存在的内剖效率低、无法实现恒虚警检测的缺点,该文通过优化内剖点选择方法、增加“外补”环节的方式对算法进行改进。最后,经实测CSIR数据及X波段试验雷达数据共同验证,在其他参数均相同时,该文方法的检测性能要优于已有的多特征检测方法,并且通过对凹包算法的复杂度分析证明了所提方法的应用潜力。  相似文献   

13.
基于简约凸壳的一类模糊支持向量机   总被引:1,自引:0,他引:1       下载免费PDF全文
为解决传统一类支持向量机对噪声数据敏感和不适用于大规模分类等问题,提出了用于大规模噪声环境的基于简约凸壳的一类模糊支持向量机(OC-FSVM-RCH).OC-FSVM-RCH根据简约凸壳的定义在核空间得到代表正常类数据几何特征的样本,然后基于改进的模糊支持向量域描述算法,使得正常类数据包含在最小超球内,异常数据与超球间隔最大化.OC-FSVM-RCH剔除正常类数据轮廓边缘处的噪声,同时对数据内部的噪声不敏感.实验结果表明了所提算法在性能和训练时间上取得了良好的效果.  相似文献   

14.
胡正平  刘立真 《信号处理》2018,34(4):448-456
针对样本集距离分类算法忽略样本集内部变化的不足,利用图像多重描述提供的互补信息,提出图像集闭包建模的协同表示人脸识别算法。首先,扩展具有多重描述能力的图像集,图像的中等强度像素携带鉴别信息利用原始图像生成中等像素图像,镜像图像可增添图像细节信息利用原始图像产生镜像图像,将此两种源域图像与原始图像联合构成扩展的图像集。然后,以无参建模构建扩展的图像集为字典闭包,同类异源域的测试图像构成图像集且构建为测试闭包,借鉴协同表示思想利用字典学习迭代求解闭包系数。最后,采用残差判别函数进行模式分类。本文方法不仅构建具有多重描述能力的图像集,而且充分利用样本集内部关联性从而获得较好的分类结果。本文分别在ORL、GT(Georgia Tech Face Database)、CMU PIE人脸数据库上进行实验。   相似文献   

15.
盛凯  刘忠  周德超  魏启航  冯成旭 《电子学报》2018,46(11):2642-2649
为了提高多类半监督分类的性能,提出了一种基于证据理论的多类协同森林算法(DSM-Co-Forest).首先,通过"多对多"模式将有标记的多类数据随机拆分为多个二类数据集,并以此训练二类基分类器;然后,利用多个基分类器同时对未标记样本进行预测,并利用证据组合算法挑选出可信度较高的未标记样本;最后,将高可信度的未标记样本加入到原训练样本中,以迭代更新其他的基分类器,从而提高分类器的整体性能.通过在一些公共数据集上进行实验,并与其他半监督分类算法进行对比,验证了所提算法的可行性和有效性.  相似文献   

16.
基于改进局部切空间排列的流形学习算法   总被引:2,自引:0,他引:2  
局部切空间排列是一种广受关注的流形学习算法,其具备实现简单、全局最优等特点,但其难以有效处理稀疏采样或非均匀分布的高维观测数据。针对这一问题,该文提出一种改进的局部切空间排列算法。首先,提出一种基于L1范数的局部切空间估计方法,由于同时考虑了距离和结构因素,该方法得到的切空间较主成分分析方法更为准确。其次,在坐标排列步骤为了减小排列误差,设计了一种基于流形结构的加权坐标排列方案,并给出了具体的求解方法。基于人造数据和真实数据的实验表明,该算法能够有效地处理稀疏和非均匀分布的流形数据。  相似文献   

17.
黄鸿  王丽华  石光耀 《电子学报》2020,48(6):1099-1107
流形学习方法可以发现嵌入于高维观测数据中的低维流形结构,但是传统的流形学习算法都是假设所有数据位于单一流形上,忽略了高维数据中不同的子集可能存在不同的流形.针对上述问题,本文提出一种监督多流形鉴别嵌入的维数约简方法,并应用于高光谱遥感影像分类.该方法首先利用样本数据的类别标签进行多子流形划分,在此基础上采用图嵌入理论构造流形内图和流形间图,然后通过最小化流形内距离同时最大化流形间距离以增强类内数据聚集性和类间数据分散性,提取低维鉴别特征,改善地物分类性能.在University of Pavia (PaviaU)和Kennedy Space Center (KSC)高光谱数据集上的实验表明,相较于其他单流形算法和多流形算法,该方法取得了更高的分类精度,在随机选取2%训练样本时,其总体分类精度分别达到88.04%和84.53%,有效提升了地物分类性能.  相似文献   

18.
We propose a novel algorithm to solve the problem of person re-identification across multiple nonoverlapping cameras by grouping similarity comparison model.We use an image sequence instead of an image as a probe,and divide image sequence into groups by the method of systematic sampling.Then we design the rule which uses full-connection in a group and non-connection between groups to calculate similarities between images.We take the similarities as features,and train an AdaBoost classifier to match the persons across disjoint views.To enhance Euclidean distance discriminative ability,we propose a novel measure of similarity which is called Significant difference distance (SDD).Extensive experiments are conducted on two public datasets.Our proposed person re-identification method can achieve better performance compared with the state-of-the-art.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号