首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 265 毫秒
1.
为改善零样本图像分类中相似度度量方法的鲁棒性,引入了一种用于零样本分类的度量学习方法.该方法由自编码构成,能在特征对齐后的语义嵌入空间中学习到最优的度量函数,用于计算测试样本特征和类标签的语义特征的相似度;然后利用近邻思想预测类别标签,进而避免产生不合适距离函数导致的分类错误.实验结果表明,与传统距离度量的算法相比,所提出的方法降低了识别错误率,在公开数据集AWA、CUB和ImNet-2上的分类准确率分别达到94.7%、63.7%和28.59%;同时表明了语义-视觉的映射方向比相反方向的识别准确率高出2.5%~10.1%.  相似文献   

2.
针对传统KNN算法性能受到所采用的相似度或距离度量方法影响大,且传统几何度量无法有效度量相似性的问题,提出一种采用拓扑相似度的KNN分类算法。首先将训练集与测试集中的数据集转化为单独的持久性图,利用拓扑数据分析(TDA)中的持续同调来提取隐藏在数据集中的重要拓扑特征,然后使用拓扑相似性度量Wasserstein距离对持久性图进行量化,最后再通过改进的K近邻机器学习算法对Wasserstein距离矩阵进行分类。从而实现不同于几何距离相似度或距离度量的拓扑分类算法。通过在UCI数据库进行实验,结果表明:与传统KNN分类算法相比,所提算法的平均精确率和F1值分别提高3.11%和2.62%,相比于其它4种改进的KNN分类方法,其准确率分别平均提高1.05%~5.95%,其F1值分别平均提高2.24%~5%,表明所提算法能够显著提高分类效果。  相似文献   

3.
&#  &#  &#  &#  &#  &#  &#  &#  &# 《西华大学学报(自然科学版)》2015,34(6):58-63
距离度量对K近邻(KNN)算法分类精度起着重要的作用。传统KNN算法通常采用欧氏距离,但该距离将所有特征的差别平等对待,忽略了数据的局部内在几何结构特征。针对此问题,文章借鉴局部保持投影(LPP)的基本思想,在考虑数据的局部内在几何结构特征基础上,依据类内局部保持散度矩阵构造一种距离度量新方法,利用该距离度量提出一种局部保持K近邻算法。实验结果表明,与采用欧氏距离和传统马氏距离的KNN相比,本算法能够得到更好的分类精度。    相似文献   

4.
分类是机器学习领域最重要的一类问题,其中K近邻法和Logistic回归是两个重要的机器学习算法。本文主要研究了K近邻算法和Logistic回归模型在数据分类问题中的具体应用。针对K近邻算法,在考虑数据特征基础上,分别用欧氏距离和曼哈顿距离作为距离度量,同时,对于Logistic回归分类问题,提出了一种改进的随机梯度上升算法。通过选取了UCI机器学习数据集中的Horse Colic、Wine Quality两个数据集对算法进行验证,应用结果表明:K近邻算法中使用欧氏距离更适合Wine Quality,并且改进的随机梯度上升算法显著提高了Logistic学习机器的训练时间,说明了K近邻法和改进Logistic回归分类算法具有良好的分类效果。  相似文献   

5.
传统的基于内容的三维模型检索的相似性度量方法主要借鉴二维图像检索中所采用的距离度量算法,达到比较两三维模型相似度的目的,该做法限制了模型间匹配的广度.针对这种单核匹配的限制,提出了一种新的多核匹配方法.利用图论中两点间的最短距离的思想,得出两模型最相似那他们的距离最短,因此查询样本跟匹配的样本存在的通路上的模型节点能影响他们的相似度,这样就提高了匹配的广度和精度.同时在已有的特征提取基础上,把标签繁衍算法应用到最短距离求解中,并将基于实例学习的K近邻方法引入到模型匹配算法中,实现了半监督学习,提高了系统的查准率.  相似文献   

6.
针对在传统卷积神经网络(Convolutional neural networks, ConvNet)算法中由于提取的静脉特征信息不足而导致指静脉识别准确率不高的问题,提出了一种基于扩展卷积神经网络与度量学习的指静脉识别算法。该算法通过扩展卷积神经网络的宽度与深度来提高ConvNet的学习能力,并使用难样本采样三元组(Triplet hard loss with batch hard mining, TriHard)度量学习函数作为网络损失函数训练网络。此外,针对常用距离度量方法不能有效度量静脉特征之间的相似度的问题,在指静脉识别阶段采用了Wasserstein距离度量方法,以提高同源静脉间的相似度,降低异源静脉间的相似度。仿真实验结果表明:在FV-USM数据集上,指静脉识别准确率达98.33%,较使用ConvNet和常用距离度量方法准确率提高了3.56%;在MMCBNU_6000数据集上,指静脉识别准确率达98.02%,较使用ConvNet和常用距离度量方法准确率提高了2.01%。  相似文献   

7.
为降低高光谱数据的信息冗余以提高其分类精度,采用加权距离度量测度来衡量样本间的相似度并进而选择近邻样本,提出一种加权近邻保持嵌入数据降维(WNPE)算法.加权距离的主要思想为根据数据点附近样本点的分布来自适应地决定距离函数,由此可以避免基于标准欧氏距离的近邻选择方法产生的数据冗余现象,从而更好地提取信息量大的光谱波段.CUPRITE矿区高光谱数据上的实验结果表明,与目前具有代表性的稀疏降维和基于流形学习的降维算法对比,WNPE能够有效提高高光谱数据的分类总精度和Kappa系数,分别达到了90.97%和0.878 6.  相似文献   

8.
在复杂网络中节点相似度度量以及密度峰值聚类算法的基础上,提出了一种基于点距离和密度峰值聚类的社区发现方法。首先,提出了基于节点相似度和节点间最短距离的节点距离度量。然后,应用密度峰值聚类方法探究网络中的社区结构,密度峰值聚类算法不仅能够检测出各个社区中心并进行相应的社区扩展,而且能够避免参数选择过程。最后,通过与经典算法在真实数据集和人工合成数据集上的比较实验,充分验证了本文方法的可行性和有效性。  相似文献   

9.
为了对船舶AIS轨迹数据进行快速聚类,本文提出了一种基于Hausdorff距离的船舶轨迹快速自适应谱聚类算法(fast self-tune spectral clustering,FSSC)。在保留轨迹特征的情况下,利用Douglas-Peucker(DP)算法对船舶轨迹数据进行预处理;基于Hausdorff距离,设计自动选取尺度参数的相似度度量函数,构造相似度矩阵并采用谱聚类算法对船舶轨迹进行聚类。以长江口水域船舶实际AIS数据为样本对算法进行了验证,结果表明:聚类结果能够准确提取水域船舶主要航路,算法消耗系统资源少,计算速度快。该方法对水域船舶主要航路识别,提高海事监管效率等方面具有参考意义。  相似文献   

10.
提出了一种结合自适应字符串距离度量的记录相似度学习方法,用于多源Web数据集成中的重复记录检测.该方法首先使用最大熵分类器标注记录对中字段间的关联类型;然后根据每个字段对的关联类型,为其选择合适的距离函数;最后使用支持向量机通过组合多字段上的相似度来检测其中的重复记录对.在不同领域的数据集上的实验结果表明,该方法能够提高重复记录检测的精度,且具有良好的噪声数据抑制能力.  相似文献   

11.
摘要:为提高处理文本相似度的效果,提出了一种基于相对熵度量文本差异的KNN算法.该算法首先对文本进行预处理(分字与删去停用字)和构建特征字字典; 然后计算训练集中所有文本特征字的概率,并组成训练集(特征字概率矩阵); 最后计算预测文本的特征字概率向量,并通过计算和统计K个预测文本与训练集文本间相对熵最小的文本类别个数后将数目最多的类别作为测试样本的类别.实验结果表明,该算法的分类效果不仅显著优于传统KNN、SVM、Decision Tree、朴素Bayes算法的分类效果,且在小样本数据情况下  相似文献   

12.
In order to implement quick and effective search, save the storage space and improve the poor performance of affinity relationshaps between high dimensional data and its codes in image retrieval, a new linear embedding hashing is proposed by introducing the preserving similarity. First, the whole data set is clustered into several classes, and then the similarity predicted function is used to maintain affinity relationships between high dimensional data and its codes so as to establish the objective function. By minimizing the margin loss function, the optimal embedded matrix can be obtained. Compared with the existing classic hashing algorithm, experimental results show that the performance of the linear embedding hash algorithm is superior to the other binary encoding strategy on precision and recall.  相似文献   

13.
为了降低谱聚类算法尺度参数对分类结果的影响,避免Nystrm逼近导致的分类结果不稳定,提出了一种基于谱聚类集成的极化合成孔径雷达(SAR)地物分类方法.首先,利用像素间的空间关系和极化信息,将基于相干矩阵Wishart距离的相似性测度和基于极化特征矢量欧氏距离的相似性测度相结合,引入马尔可夫随机场势函数,构造谱聚类的相似性矩阵;然后,采用基于Nystrm逼近的谱聚类实现极化SAR数据的单次谱分类;最后,采用集成策略完成对极化SAR图像的地物分类.实验结果表明,该算法提高了分类精度,区域一致性保持较好,且分类结果稳定.  相似文献   

14.
为了解决宽基线多图匹配中匹配效率低和匹配精度不高的问题,使用经典的SIFT特征作为描述子,提出一种新的高维特征搜索算法.采用基于距离尺度的相似性度量准则,首先将图像高维特征集合分类,然后为每一个类建立B+Tree索引,最后在KNN(K Nearest Neighbor)搜索阶段应用基于关键维过滤的查找策略,实现高维特征的快速匹配.实验结果表明,与经典的BBF和LSH等KNN搜索算法相比较,关键维过滤搜索算法具有更高的搜索效率和搜索精度,有助于提升宽基线多图匹配性能.  相似文献   

15.
针对自然图像场景分类问题,根据Citation-kNN算法思想,提出一种新的基于多示例学习(MIL)的图像分类方法。将整个图像当作多示例包,图像分割的区域当作包中的示例,在度量图像包间的相似距离时,利用改进的推土机距离(EMD)代替Citation-KNN算法中的最小Hausdorff距离(minHD),用于图像分类。在Corel图像库上的对比实验结果表明,分类准确率更高。  相似文献   

16.
作为一种经典的文本分类算法,KNN简单、实用,在许多实际系统中有广泛的应用,但若待分样本位于易判区域时,KNN却做了许多无用计算。基于此,本文提出一种改进算法,借鉴于蚁群算法,引入了组相似度这个新颖概念,使得当待测样本位于易判区域时,能很快得出判定结果;当待测样本位于难判区域时,该算法退化为KNN的原始算法。  相似文献   

17.
在支持向量机(SVM)方法中采用模糊☆近邻方法进行样本预选取,旨在保留最优分类超平面附近的样本点,去除远处样本点,使训练样本集减小,消除冗余,从而减小所需内存.实验结果表明,该方法无论是训练速度还是分类精度都远远好于单独的SVM分类器.  相似文献   

18.
基于Fuzzy ART的K-最近邻分类改进算法   总被引:4,自引:0,他引:4  
提出了一种K-最近邻改进算法,该算法用模糊自适应共振理论(Fuzzy ART)对K-最近邻的训练样本集进行浓缩,以改善K一最近邻的计算速度.该算法首先用Fuzzy ART将训练样本集中的每一类样本进行聚类,减小了训练样本集的数据量,提高了算法的计算速度,保持了预测精度,从而使该算法适用于海量数据集的情况.实验表明,该算法适用于对复杂而数据量较大的数据库进行分类.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号