首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 186 毫秒
1.
为了解决行人再识别以及车辆再识别算法中网络训练过程对计算资源的消耗过大且准确率较低的问题,提出基于能量模型的目标分类和度量学习方法. 利用样本特征空间中同类样本的低能量分布特性, 设计对比能量损失函数,形式上表达为训练样本在真实目标类别上的损失函数响应和非目标类别上的响应之差,可以更准确地增大目标响应,抑制非目标响应, 提高了分类准确率,使得同类样本特征更聚集、异类样本特征更远离. 在多个行人再识别和车辆再识别数据集上的测试结果显示, 相对于Soft-max和Triplet混合损失函数, 利用能量模型可以提升网络训练效率,提高目标再识别准确率.  相似文献   

2.
针对在传统卷积神经网络(Convolutional neural networks, ConvNet)算法中由于提取的静脉特征信息不足而导致指静脉识别准确率不高的问题,提出了一种基于扩展卷积神经网络与度量学习的指静脉识别算法。该算法通过扩展卷积神经网络的宽度与深度来提高ConvNet的学习能力,并使用难样本采样三元组(Triplet hard loss with batch hard mining, TriHard)度量学习函数作为网络损失函数训练网络。此外,针对常用距离度量方法不能有效度量静脉特征之间的相似度的问题,在指静脉识别阶段采用了Wasserstein距离度量方法,以提高同源静脉间的相似度,降低异源静脉间的相似度。仿真实验结果表明:在FV-USM数据集上,指静脉识别准确率达98.33%,较使用ConvNet和常用距离度量方法准确率提高了3.56%;在MMCBNU_6000数据集上,指静脉识别准确率达98.02%,较使用ConvNet和常用距离度量方法准确率提高了2.01%。  相似文献   

3.
为适应开放场景下说话人识别短时语音的应用需要,本文对说话人识别模型进行优化,提升了模型的准确率和鲁棒性.为了实现对重要频率特征的筛选,提出基于重加权的特征增强层及网络,起到增强特征表达的作用.将人脸识别领域的误分类样本损失函数首次引入到说话人识别领域,提高对困难样本的挖掘能力.提出基于误分类样本挖掘的分类损失与基于小样本学习框架的余弦角度原型损失的组合损失函数,解决了分类损失函数与说话人识别实际评测需求不匹配和度量函数对采样策略依赖性强的问题.实验结果显示,与基准模型相比,性能指标等误率(EER)降低12.45%,最小检测代价函数(minDCF)降低14.09%,取得现有说话人识别领域的优异效果.  相似文献   

4.
为改善零样本图像分类中相似度度量方法的鲁棒性,引入了一种用于零样本分类的度量学习方法.该方法由自编码构成,能在特征对齐后的语义嵌入空间中学习到最优的度量函数,用于计算测试样本特征和类标签的语义特征的相似度;然后利用近邻思想预测类别标签,进而避免产生不合适距离函数导致的分类错误.实验结果表明,与传统距离度量的算法相比,所提出的方法降低了识别错误率,在公开数据集AWA、CUB和ImNet-2上的分类准确率分别达到94.7%、63.7%和28.59%;同时表明了语义-视觉的映射方向比相反方向的识别准确率高出2.5%~10.1%.  相似文献   

5.
针对基于度量学习的小样本学习方法中嵌入模块泛化能力差、提取图像级表征可能会损失大量辨别信息的问题,提出一种自适应的局部关系网络。该网络引入一个自注意力机制,使嵌入模块能够提取到每个类别特定的信息,将信息从任务无关的泛化概念转化为任务相关的独有特征;同时引入局部描述子的思想,每个局部描述子对应图片中的一个区域,通过局部描述子将关注点放在图像与类别之间的比较,有效消除类内差异和背景混淆,再将局部描述子与一种非线性的度量方式进行融合,应用改进的损失函数对图片进行分类识别。在MiniImagenet和Omniglot两个小样本学习常用数据集上的实验表明,改进算法能够高效地提高分类准确率。  相似文献   

6.
为了解决车辆管控工作中出现的肇事车辆逃避交通监管的问题,对数据集处理方式和局部特征的车型分类算法进行研究.首先,以AlexNet网络为基础分析了各个网络结构对于输入图片的敏感程度,从网络层数和卷积核尺寸上进行网络优化得出IM-AlexNet网络.然后,使用数据增强方式处理后的自建数据集,训练IM-AlexNet分类模型网络.最后,在HOG-SVM、GoogleNet和VGG16三种模型上进行对比实验并分析.实验结果表明:IM-AlexNet网络在验证集上准确率达到96%左右,损失值低于0.2,训练速度达到3 s/step.在混淆矩阵中IM-AlexNet网络模型总体准确率达到69%,完成了局部特征对车型分类的实验,分类准确率大大提高.  相似文献   

7.
RS与FNN集成在焊接缺陷识别中应用   总被引:1,自引:0,他引:1  
针对焊接图像缺陷识别中提取的特征受噪声干扰比较严重,以及现有的识别算法准确率低的问题,提出了一种粗糙集(RS)和模糊神经网络(FNN)集成的缺陷识别算法.首先使用模糊C-均值聚类算法对样本属性离散化,然后使用RS对离散化后的样本数据进行属性约简得到决策规则,并使用π函数根据聚类的中心和半径对属性进行模糊化,克服RS对噪声敏感问题;根据得到的精简模糊决策规则和模糊逻辑推理确定FNN的结构,使用依赖度和规则的条件覆盖度确定网络的初始参数,考虑到样本中数据的可信度问题,用加权代价函数调整模型参数.仿真实验表明,本算法解决了分类过程中样本数据受到噪声干扰引起的不确定性、FNN结构难以确定的问题,能有效地提高焊缝图像缺陷的识别能力.  相似文献   

8.
为了解决卷积神经网络(CNN)在语义分割特征提取阶段容易丢失空间信息以及边界信息不明确的问题,基于U-Net基线网络提出空间全局上下文信息网络(NC-Net). 增加再编码阶段(ReEncoder),以增强空间信息识别能力. 在Decoder阶段输出多尺度特征,与ReEncoder阶段结合获取全局上下文信息. 保留边界损失函数,设计多尺度损失函数级联方法,优化整体网络. 在GID以及WHDLD数据集上的实验结果表明,该方法的总体准确度达到最好成绩,明显优于其他基线模型.  相似文献   

9.
目前现场接触网吊弦缺陷图像严重不足,导致模型特征学习不充分,识别准确率难以得到有效提高,为此提出基于组合零样本学习的接触网吊弦线缺陷识别方法.采用以ResNet-50作为主干网络的视觉特征提取模块提取图像视觉特征;使用预训练的Word2Vec词向量对标签组合图中的节点特征进行初始化,并通过2层图卷积网络学习标签组合图中各节点之间的依赖关系,从而优化组合标签节点的语义特征,改善最终的识别效果;将提取到的视觉特征和优化后的组合标签节点的语义特征相对齐,构建相似度函数计算图像视觉特征与组合标签语义特征之间的相似度得分,并通过交叉熵损失完成图像组合标签的预测.仿真实验结果表明:所提方法对可见类样本的类平均检测准确率为93.5%,对不可见类样本的类平均检测准确率为86.5%.  相似文献   

10.
针对有监督学习容易造成未标记样本的浪费和手动特征提取容易导致信息丢失的问题,提出一种基于深层堆叠网络(DSN)的半监督特征学习方法,无监督特征学习的过程由多个受限玻尔兹曼机(RBM)的并行训练完成,将训练得到的参数用于DSN的输入权值初始化,再采用批量模式的梯度下降法进行监督微调。将所提方法用于运动想象脑电信号特征提取及识别,实验结果表明本文方法能够充分利用未标记样本中的隐含信息,有效提取脑电信号特征,识别结果优于共同空间模式(CSP)和深度信念网络(DBN)等算法,该方法可用于提高BCI系统中脑电信号的识别准确率。  相似文献   

11.
针对样本总体分布已知的分类问题,提出了一种新的分类方法.通过非线性映射将训练样本映射到高维特征空间,基于向量投影法从训练样本中选择边界向量,运用多维二叉树搜索法确定每个边界向量同类中的k-近邻,运用统计理论中的大数定理估计样本的类条件概率密度函数,由边界向量与相应的密度函数构成新的训练样本对.对每一类数据建立一个径向基函数(RBF)网络,以相应类的边界向量作为中心,通过训练以RBF网络来估计样本的类条件概率密度,并采用基于最小错误率的贝叶斯决策来实现分类.对机器学习数据的仿真研究结果表明该方法具有与支持向量机(SVM)相似的识别率,并且能快速有效地实现多类分类.  相似文献   

12.
为了有效利用少量先验信息提高多视角数据聚类效果,提出了一种基于距离度量学习的半监督多视角谱聚类算法(简称ML-SMC)。首先,利用距离度量学习引入先验信息,将多视角数据映射到反映先验约束条件的空间.然后,根据相似性构造每个视角的视图,将多视角聚类问题转化为最小正则割的图划分问题。实验结果表明:ML-SMC算法聚类结果的精度优于3种经典的多视角聚类算法和4种半监督单视角聚类算法。并且通过利用少量先验信息ML-SMC算法能够有效提高聚类效果。  相似文献   

13.
To improve the accuracy of cross-modal pedestrian re-identification,a reciprocal bi-directional generative adversarial network-based method is proposed.First,we build two generative adversarial networks to generate cross-modal heterogeneous images.Second,an associated loss is designed to pull close the distribution of features in latent space during the image translation between visible and infrared images so as to help the networks generate fake heterogeneous images that have high similarity with the real images.Finally,by concatenating the original and generated heterogeneous pedestrian images into the discriminative feature extraction network,images from different modalities can be unified into a common modality,thus suppressing the cross-modal gap.Representation learning and metric learning are utilized to achieve more discriminative pedestrian features.Comparative experiments are conducted on SYSU-MM01 and RegDB datasets to analyze the accuracy with different loss functions.Compared with other state-of-the-art cross-modal pedestrian re-identification methods,the proposed method achieves a higher accuracy and stronger robustness.  相似文献   

14.
To improve the learning efficiency for hard samples and reduce noise interference caused by superfluous hard samples in deep hash algorithm,a generic strategy called Loss to Gradient for hard sample learning is proposed.First,a non-uniform gradient normalization method is proposed to improve the learning ability of models for hard samples.Back propagation gradients are weighted by calculating the loss ratio between hard samples and all samples.Furthermore,a weighted random sampling method is designed for accuracy improvement with superfluous hard samples.According to the loss,training samples are weighted and under-sampled for noise filtering and a small number of hard samples are retained to avoid over-fitting.Based on open datasets,the average accuracy of hash feature retrieval is increased by 4.7% and 3.4%,respectively.Experimental results show that the improved method outperforms other benchmarking methods in accuracy,proving that the feature representation of hard samples in the dataset can be effectively learned.  相似文献   

15.
为缓解基于半监督学习的水面目标检测对有限标注样本过拟合的问题,提高无标注样本中目标提取的有效性,提出了基于多视图交叉一致性学习的半监督水面目标检测算法。首先,该算法通过数据增强的方式为训练样本生成不同的视图以丰富数据集的多样性;然后,利用所提出的多视图目标判别器为无标注样本在线生成伪标签,有助于提取无标注样本的有效信息;最后,利用所提出的多视图交叉一致性学习使同一目标实例的不同视图的输出实现交叉一致性正则化,以促进检测模型学习判别性的特征从而降低过拟合的风险。在海上和内河数据集上的实验结果表明:文中所提算法能够提高特征提取的判别性,对多类别的水面目标检测精度达到91.0%,比全监督检测算法提高了18.7%,比其他半监督检测算法提高了3.8%以上;在检测速度上,该算法达到13.1帧/s,基本满足实时性要求。所提算法通过多视图交叉一致性学习提高特征的判别性和缓解检测模型的过拟合风险,有助于提高半监督水面目标检测的性能。  相似文献   

16.
针对视频监控环境下采集的可用行人图像数量有限,以及非可靠数据标注导致监督学习算法性能下降等问题,提出一种融合Gabor特征和卷积特征的无监督小样本行人重识别方法。采用Gabor变换提取多尺度、多方向行人纹理和边缘信息,实现小样本行人图像特征级数据增强,进一步通过特征编码消除冗余信息,提升相似度比对效率。采用卷积自编码网络提取行人非线性深度卷积特征,避免监督学习算法对数据标注的依赖性。融合两种异构特征用于行人相似度比对,实现小样本下行人特征数据的拓展,同时实现行人特征判别能力增强。在Market-1501和DukeMTMC-reID数据集的试验中rank-1准确度分别达到74%和67.1%,证明所提网络架构能有效提升小样本行人重识别的性能。  相似文献   

17.
为了解决道路分叉环境中的智能车辆导航问题,提出一种大视场、近距离的道路检测方法.采用安装于车头的鱼眼摄像机,克服了普通相机视野窄、近处存在盲区的问题;通过鱼眼图像重投影,去除鱼眼畸变和透视失真,获得尺度一致的数据块;应用非监督特征学习和逻辑回归分类器,从海量未标记数据中得到原始数据块的稀疏表达,免除了人工标记数据,最后得到路面可通行概率.实验结果表明:此算法在缺乏先验道路几何信息、无手工标记数据的情况下,可以正确地识别分叉道路可通行区域,无视野盲区.  相似文献   

18.
A group activity recognition algorithm is proposed to improve the recognition accuracy in video surveillance by using complex wavelet domain based Cayley-Klein metric learning. Non-sampled dual-tree complex wavelet packet transform (NS-DTCWPT) is used to decompose the human images in videos into multi-scale and multi-resolution. An improved local binary pattern (ILBP) and an inner-distance shape context (IDSC) combined with bag-of-words model is adopted to extract the decomposed high and low frequency coefficient features. The extracted coefficient features of the training samples are used to optimize Cayley-Klein metric matrix by solving a nonlinear optimization problem. The group activities in videos are recognized by using the method of feature extraction and Cayley-Klein metric learning. Experimental results on behave video set, group activity video set, and self-built video set show that the proposed algorithm has higher recognition accuracy than the existing algorithms.  相似文献   

19.
In order to solve the problem of over-fitting of traditional supervised learning methods in anomaly detection of unbalanced datasets, an unsupervised adversarial learning method is proposed for hard disk failure prediction. This method uses the long short-term memory neural network and fully connected layer to design an Autoencoder that can be used for secondary coding. Only normal samples are used for training. By reducing the reconstruction error and the distance between potential vectors, the model can learn the data distribution of normal samples, thus improving the generalization ability of the model. The model also introduces the generative adversarial network to enhance the effect of unsupervised learning. Experiments on several datasets show that the recall rate and precision of the proposed method are higher than those of traditional supervised learning and semi-supervised learning classifiers, and that its generalization ability is stronger. Therefore, the unsupervised adversarial learning method is effective in hard disk failure prediction.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号