首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 265 毫秒
1.
在车辆重识别任务中,通常会出现相机角度变化和场景变化等情况,导致重识别准确率降低,为此提出了一种基于注意力与多尺度融合学习的车辆重识别方法,在多尺度下提取并融合浅层细节信息和深层语义信息。首先,构造一种深度学习网络,通过注意力机制学习车辆图像的显著性特征;然后,在多个尺度下对描述车辆身份的信息进行提取,将浅层表达的细节信息和深层表达的语义信息相融合构造空间特征;其次,对空间特征进行分解与重组,得到具有空间鲁棒性的局部特征,并与全局特征融合,构造车辆身份重识别特征;最后,利用该特征计算不同车辆图像间相似度,判断是否具有相同的身份。实验结果表明:在VeRi-776数据集上测试得到的Rank-1指标达到了94.0%,mAP指标达到了72.2%,表明该方法在相机角度变化、场景变化等情况下可以有效提高车辆重识别的准确率。  相似文献   

2.
基于小波模极大值和SVM的智能车辆障碍物检测   总被引:1,自引:0,他引:1  
针对复杂交通场景中智能车辆前向障碍物检测问题,根据障碍物的后视视觉特征,提出了一种基于小波模极大值和支持向量机的障碍物检测方法.利用小波变换对奇异信号的多尺度分析,并结合障碍物先验知识的多特征组合,对候选障碍物区域进行检测;构建了一种适合于交通场景中障碍物分类的二叉树支持向量机(BT-SVM)多类分类器,对候选障碍物区域进行确认识别.将该方法应用于高速公路、城区道路等多种交通场景中,实车实验结果表明了本方法的有效性、实时性和通用性.  相似文献   

3.
目前基于视频图像的火灾识别系统是大空间场景中预防火灾的有效方法。为了提高检测性能,基于火焰特定的纹理结构,使用多尺度纹理特征,以获得更全面的特征信息。首先使用火焰的明亮特性定位到疑似火焰区域;然后针对这些区域,采用局部二值模式(local binary patterns, LBP)方法提取多尺度纹理特征;最后将多尺度LBP纹理特征输入到支持向量机(support vector machine, SVM)中进行识别。实验结果表明,该方法计算简单,火焰的检测率较高,误警率较低。  相似文献   

4.
针对卷积神经网络中间特征层信息利用不充分,以及不区分尺度和难易样本的学习所导致的文字检测精度难以提高的问题,提出基于多路精细化特征融合的聚焦难样本的区分尺度的自然场景文字检测方法. 构建多路精细化的卷积神经网络融合层提取高分辨率特征图;按照文字标注矩形框的较长边的尺寸,将文字实例划分为3种尺度范围,并分布到不同的候选框提取网络中提取相应的候选框;设计聚焦损失函数对难样本进行重点学习以提高模型的表达能力并得到目标文字框. 实验表明,所提出的多路精细化特征提取方法在COCO-Text数据集上的文字召回率较高,聚焦难样本的区分尺度的文字检测方法在ICDAR2013、ICDAR2015标准数据集上的检测精度分别为0.89、0.83,与CTPN、RRPN等方法相比,在多尺度多方向的自然场景图像中具有更强的鲁棒性.  相似文献   

5.
基于传统深度学习技术实现的道路交通标志识别系统通常遵从完全数据驱动模式,导致它们在真实世界的开放场景中存在性能不稳定和极大的安全隐患.为缓解该问题,提出一种基于道路交通标志设计标准的语义数据集构建方法,并利用零样本学习机制设计一个通用的具备推理能力和可解释性的道路交通标志识别框架,其能够有效应对实践中面临的道路交通标志的动态更新和类别缺失问题.利用国家道路交通标志制定标准来抽象出所有类别的通用属性,并将这些属性信息作为领域知识注入传统数据驱动模型的训练过程中.在领域知识的帮助下,所提基于零样本学习的交通标志识别方法能够比随机预测和传统深度学习模型更准确地识别出训练阶段未见过的交通标志.在中国交通标志数据库(Chinese traffic sign database, CTSDB)和德国交通标志识别基准数据集(German traffic sign recognition benchmark, GTSRB)上的实验结果表明,采用所提方法进行训练后,语义自编码模型在传统零样本学习的设定下,对于训练阶段未曾见过的交通标志的识别准确率分别比随机预测提升了至少29.96%和24.25%.  相似文献   

6.
针对现有基于深度学习的方法存在的难以识别相交特征、无法精确确定加工特征面的问题,提出基于图神经网络的加工特征识别方法.通过压缩激励模块提取节点与邻接边的特征,构建节点级与邻接边级的双层注意力网络,分割每个节点对应的加工特征.该方法充分利用了零件模型的面特征与边特征,结合零件模型的拓扑结构,基于注意力机制对特征信息进行深度学习,可以有效地解决非面合并相交特征的识别问题.在多加工特征零件数据集上,将该方法与其他3种特征识别方法进行实验对比,在准确率、平均类准确率和交并比3项指标上均取得最优结果,识别准确率高于95%.  相似文献   

7.
为精准识别双时相遥感图像的变化区域,提出了一种基于多尺度融合的遥感图像变化检测模型。该模型在源图像特征提取阶段构造多尺度输入金字塔,接受多层次的感受野,增强对特征信息的感知;并通过对深层差异特征进行多尺度计算,实现精准定位变化区域与充分挖掘细节信息间的平衡;同时融合网络不同层级的差异特征检测结果,极大程度识别并保留语义变化信息。实验结果表明:本文模型在主观评价与客观指标上都具有良好的表现效果。  相似文献   

8.
在遮挡物较多的变电站场景下, 传统的目标跟踪算法容易出现人员跟丢、身份变换、目标被遮挡无法识别等情况, 无法做到对目标的准确实时跟踪。针对此问题, 提出了融合度量学习与卡尔曼滤波的变电站运动目标跟踪方法。首先, 采用融合多尺度特征的YOLOv3算法检测目标, 利用带权值的匈牙利算法匹配目标的历史运动轨迹; 然后, 通过卡尔曼滤波进行轨迹预测, 并应用度量学习匹配预测轨迹与历史运动轨迹, 结合目标外观特征信息, 以实现变电站内运动目标的跟踪; 最后, 以变电站场景下的人员为例进行实验, 结果表明, 人员跟踪准确率高, 且能满足变电站应用场景下的鲁棒性和实时性要求。  相似文献   

9.
提出鲁棒多尺度地震层位识别与可视化方法,解决复杂层位识别和分类难题.为了抑制噪声,增强层位连续性,提出基于三边滤波的地震体数据结构增强算法.对于结构增强的地震体数据,提出多尺度层位识别方法,根据层位平坦度在层位识别过程中自动调整识别尺度实现层位自动分类.为了观察所识别的层位,给出多体可视化与层位识别过程可视化方法.集成地震体数据结构增强算法、多尺度层位识别方法和层位可视化方法等新技术为一个地震层位识别与可视化系统.大量实验结果验证了该层位识别方法的有效性.  相似文献   

10.
为了提升交通标志自动识别的精度,提出一种基于多尺度CNN的交通标志识别方法(TSR -MSCNN算法).该方法采用三阶段卷积神经网络,融合了低阶、中阶和高阶3种不同尺度的特征,并串联了多个小卷积层用以代替单个较大卷积层.通过对全连接层的神经元个数、Dropout参数、卷积核尺寸等网络超参数进行选比实验,获得了最佳的网络超参数.利用德国交通标志基准数据库(GTSRB)对不同算法进行测试表明,本文提出的算法在较小的网络参数量下能够有效提取交通标志特征,获取的识别准确率达到99.76%,且显著优于传统卷积神经网络方法和多尺度特征方法的识别准确率,因此本文算法在图像识别领域有良好的应用价值.  相似文献   

11.
弱监督显著性目标检测中常存在目标错检、区域检测不全和目标边界不清晰等问题。针对上述问题,提出了一种基于渐进式网络的弱监督显著性目标检测算法,将显著性目标检测分为目标定位、显著性区域完善和目标边界细化3个子任务分阶段完成。首先,将输入图像采样为3个不同尺度的图像,分别输入渐进式网络的3个阶段进行学习;其次,在目标定位阶段设计了嵌套位移多层感知机,平衡网络的全局信息与局部信息的提取能力,以更好地定位显著性目标;最后,根据显著性图的结构不受尺度变化影响的特点,设计了异尺度自监督模块和目标一致性损失函数来构建自监督机制,使网络能够输出区域完整、边界清晰的显著性图。在5个数据集上测试所提算法,其客观指标与主观评价都优于最近的弱监督算法,且在F值指标上可以达到相关全监督算法89%的性能。实验结果表明,所提算法能生成显著性区域更完整、显著性目标边界更锐利的显著性图,且具有良好的鲁棒性。  相似文献   

12.
为提高雾霾图像清晰化效果并实现去雾能力的泛化,提出一种特征增强及多尺度损失约束的网络结构,并采用增量式训练方法对网络进行训练。网络由教师网络和学生网络构成。通过学习教师网络提取的标注样本注意力信息对学生网络提取的特征进行特征增强;将标注样本多尺度语义特征作为软标签,建立多尺度语义特征损失衡量机制,与全局像素差异损失级联,构建面向特征和像素的损失函数;采用增量式训练方法,教师网络为学生网络平衡不同数据集的新旧知识提供先验约束,使网络保留原有知识的前提下,快速提高对增补数据集的泛化能力。实验结果表明,所提算法在主观视觉效果与客观评价指标上均取得了较好的效果。  相似文献   

13.
为了从医疗图像中自动且准确地提取兴趣区域, 提出基于神经网络的分割模型MS2Net. 针对传统卷积操作缺乏获取长距离依赖关系能力的问题, 为了更好提取上下文信息, 提出融合卷积和Transformer的架构. 基于Transformer的上下文抽取模块通过多头自注意力得到像素间相似度关系, 基于相似度关系融合各像素特征使网络拥有全局视野, 使用相对位置编码使Transformer保留输入特征图的结构信息. 为了使网络适应兴趣区域形态的差异, 在MS2Net中应用解码端多尺度特征并提出多尺度注意力机制. 对多尺度特征图依次应用分组通道和分组空间注意力, 使网络自适应地选取合理的多尺度语义信息. MS2Net在数据集ISBI 2017和CVC-ColonDB上均取得较U-Net、CE-Net、DeepLab v3+、UTNet等先进方法更优的交并比指标, 有着较好的泛化能力.  相似文献   

14.
针对传统神经网络仅利用端层特征进行分类导致特征不全面,以及交通标志识别中计算量大、时间长等问题,提出基于多层特征表达和极限学习机的交通标志识别方法。利用CNN网络提取多层交通标志特征图;采用多尺度池化操作,将提取出的各层特征向量联合形成一个具有多尺度多属性特征的交通标志特征向量;使用极限学习机分类器准确快速地实现交通标志的识别。实验结果表明,该方法能有效地提高交通标志识别的准确率,且具有较好的泛化能力和实时性。  相似文献   

15.
近年来许多基于通用目标检测框架的文本检测方法相继被提出,这些方法往往是直接预测文本的整个边界框,受网络感受野的限制而难以有效检测长文本。为改进长文本难以有效检测的问题,提出了基于短边顶点回归网络的文本检测方法。该方法将文本区域划分为3类区域,即两条短边附近的区域及中间区域,采用分离再组合的方式检测文本,不再直接预测文本的整个边界框。首先,在一个融合多层特征的残差网络上预测分割3类文本区域,同时还将在每个短边区域的像素点处预测与之邻近的一条短边的两个顶点。然后,在后处理过程中,利用文本中间区域与短边区域相邻的关系将文本两类短边区域进行组合,两类短边区域预测的短边顶点将随之结合,便能产生完整精确的文本检测结果。在一个长文本检测数据集和公开的MSRA-TD 500,ICDAR 2015及ICDAR 2013自然场景文本检测数据集上进行测试比较,该方法的精度与速度超过目前绝大部分方法。实验结果表明,该方法在文本检测,尤其是长文本检测,具有一定的优越性。  相似文献   

16.
雨纹分布和形状具有多样性,现有去雨算法在去雨的同时会产生图像背景模糊、泛化性能差等问题.因此,本文提出一种基于注意力机制的多尺度特征融合图像去雨方法.特征提取阶段由多个包含两个多尺度注意力残差块的残差组构成,多尺度注意力残差块利用多尺度特征提取模块提取及聚合不同尺度的特征信息,并通过坐标注意力进一步提高网络的特征提取能力.在组内进行局部特征融合,组间利用全局特征融合注意力模块更好地融合不同层次的特征,通过像素注意力使网络重点关注于雨纹区域.在仿真和真实雨像数据集上与其他现有图像去雨算法相比,本文方法的定量指标有着明显提高,去雨后的图像视觉效果较好且具有良好的泛化性.  相似文献   

17.
The integrity and fineness characterization of non-connected regions and contours is a major challenge for existing salient object detection. The key to address is how to make full use of the subjective and objective structural information obtained in different steps. Therefore, by simulating the human visual mechanism, this paper proposes a novel multi-decoder matching correction network and subjective structural loss. Specifically, the loss pays different attentions to the foreground, boundary, and background of ground truth map in a top-down structure. And the perceived saliency is mapped to the corresponding objective structure of the prediction map, which is extracted in a bottom-up manner. Thus, multi-level salient features can be effectively detected with the loss as constraint. And then, through the mapping of improved binary cross entropy loss, the differences between salient regions and objects are checked to pay attention to the error prone region to achieve excellent error sensitivity. Finally, through tracking the identifying feature horizontally and vertically, the subjective and objective interaction is maximized. Extensive experiments on five benchmark datasets demonstrate that compared with 12 state-of-the-art methods, the algorithm has higher recall and precision, less error and strong robustness and generalization ability, and can predict complete and refined saliency maps.  相似文献   

18.
基于支持向量机(SVM)的卷积神经网络(CNN)模型结合了大间隔原理,在图像识别中表现出了优异的泛化性能。然而,该方法忽视了一个关键:SVM的泛化性能不仅取决于不同类之间的间隔,还与所有样本的最小包含球(MEB)的半径有关。针对这一事实,文章提出一种基于半径间隔界(RMB)驱动的CNN模型的图像特征提取和识别的方法。与传统CNN模型相比,该模型采用基于SVM泛化误差界的策略来指导CNN深度模型学习和相应分类器构建,不仅考虑了不同类别之间的间隔,还考虑了MEB的半径。该模型能提高深度卷积模型的泛化能力而不会额外增加网络的复杂度,还能够应用于不同的深度模型中而不受限于某一特定的网络结构。在多个数据集上的实验结果表明,相比于基于Sofmax损失的CNN模型、基于中心损失的CNN模型以及基于 SVM 的 CNN 模型,该模型能够提取到鉴别性更强的图像特征,取得更高的识别率。  相似文献   

19.
1 INTRODUCTIONLocalization is fundamental in the domain ofmobile robot navigation. Current localizationmethods based on camera can be mainly classifiedas geometric and topological . Topological methodsuse an adjacent graphin replace of exact coordinateto represent environment . For this reason, theyare dominant inlocalization based on monocular vi-sion[1]. In general , these topological approachesare based on either landmark detection or place rec-ognition.For landmark detection, mobile …  相似文献   

20.
基于卷积神经网络框架,提出一种洗衣机异音识别模型,根据卷积神经网络显著特征提取能力和平移不变性,学习洗衣机的异音特征,实现生产线洗衣机的异音自动智能识别。给出完整的过程解决训练数据集的建立、数据样本不平衡等问题。提出一种用于数据增强的网络模型——音频深度卷积生成对抗网络解决训练样本的稀缺性问题。该模型对传统的深度卷积生成对抗网络进行改进,以更好地适应工业音频的生成。利用该模型能够对原始数据进行扩展,生成洗衣机异音增强数据集,在该数据集的基础上进行卷积神经网络训练,经测试准确率达到0.999。利用添加背景噪声信号的数据集测试洗衣机异音识别模型的泛化能力,正确识别率达到0.902,表明该网络在识别洗衣机异音方面具有良好的鲁棒性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号