首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
针对视频行人重识别任务中存在的行人外观、遮挡等问题,研究并设计了一个基于金字塔分割和注意力机制的视频行人重识别模型。首先,为了增强图模型对行人局部特征的识别能力,提出了多个尺度的水平金字塔分割方法,将各特征分别分割成不同大小的区域,并池化成统一尺寸后输入图模型。另外,鉴于简单的时空注意模块容易因遮挡破坏行人特征,因此使用时空相关注意力方法改进时空注意模块,逐步学习并聚合空间局部信息,同时在时序上相互作用,抑制行人干扰特征并增强判别特征。将模型在Mars和DukeMTMC-VideoReID两个数据集上进行了评估,实验结果证实了文中提出方法的有效性。  相似文献   

2.
针对行人重识别中水平切片方法由于分块特征感受野之间存在交叉重叠带来的分块数量限制问题,提出一种基于Transformer的行人重识别网络结构。首先,输入图像经过CNN网络提取中间特征图,并将特征图进行分块,对每块特征进一步切分成像素级token向量;然后,对各像素级token向量展平并加入位置编码和全局token向量,输入Transformer IN编码器中;接着,对得到的全局token向量进一步加入分类token向量和位置编码后,输入Transformer OUT编码器,得到最终的编码器输出;最后,取分类token向量并加上全连接后,利用softmax和交叉熵损失对行人进行分类。在Market-1501、Duke MTMC-re ID数据集上的实验结果表明,本方法能够更细粒度地提取特征,并利用Transformer的全局把控能力,进一步提高了切片的数量和分类的精度。  相似文献   

3.
针对已有的动作识别方法的特征提取不足、识别率较低等问题,结合双流网络、3D卷积神经网络和卷积LSTM网络的优势,提出一种融合模型. 该融合模型为了更好地提取人体动作特征,采用SSD目标检测方法将人体目标分割出作为局部特征和原视频的全局特征共同训练,并采用后期融合进行分类; 将3D卷积块注意模块采用shortcut结构的方式融合到3D卷积神经网络中,加强神经网络对视频的通道和空间特征提取; 并且通过将神经网络中部分3D卷积层替换为ConvLSTM层的方法,更好地得到视频的时序关系. 实验在公开的KTH数据集  相似文献   

4.
在解决行人再识别技术中的姿态变化、遮挡、背景等问题时,为了提高遮挡下的行人再识别性能,提出一种基于注意力机制和姿态识别的行人再识别方法。采用全局注意网络和姿态识别网络分别提取行人图像的全局特征、关节点位置热力图和对应的置信度,通过计算得到行人13个关节点和融合所有关节点的局部特征,对全局特征和14个局部特征分别进行行人分类训练,利用多任务学习多个损失共同监督网络的优化。测试时,将关键点特征和全局特征融合后,计算行人的距离排序。在Market1501和DukeMTMC-reID数据集上测试的Rank-1/mAP指标分别达到了85.1%/75.6%和64.3%/55.3%。结果表明,所设计方法具备抗姿态变化、遮挡和背景的能力,同时具有较高的识别能力和识别精度。  相似文献   

5.
提出了一种基于导向滤波器和视差校准的自适应权重算法。首先,使用梯度与色彩相结合的相似测度计算不同视差的原始匹配代价,构成三维代价卷,使用导向滤波器对其进行滤波,有效保持边缘信息,提高了初始匹配精度,并通过积分图像方法降低了运算复杂度;然后,增加了视差校准步骤,根据色彩相似性和空间相近性分配自适应权重,对初始视差图进行校准,进一步提升匹配精度。利用Middlebury网站提供的标准立体图像对进行匹配精度验证,结果表明:算法可以有效消除歧义匹配,获得精度较高的稠密视差图。通过真实图像对算法进行了验证,能够在一定程度上恢复景物的三维信息。  相似文献   

6.

行人重识别的目的是在多个不重叠的摄像头之间检索特定的行人. 对目前有代表性的基于深度学习的行人重识别算法进行归纳和总结, 综述不同类型的行人重识别算法的结构和特点. 首先,介绍行人重识别的概念; 其次,根据行人重识别算法的特点, 概述基于监督学习和弱监督学习的行人重识别算法,并对特征表示学习和深度度量学习2种基于监督学习的行人重识别算法进行详细讨论; 然后,介绍这一领域的经典数据集, 对有代表性的算法在这些数据集上的表现进行对比分析; 最后,展望行人重识别领域的发展方向.

  相似文献   

7.
抓取主要分为抓取检测、轨迹规划和执行环节,准确的抓取检测是完成抓取任务的关键。为进行更准确的抓取检测,提高机器人抓取性能表现,本研究以关键点检测算法为基础,提出了一种融合注意力和多任务学习的抓取检测算法。首先,针对任务特点,在特征提取环节引入CA(coordinate attention)注意力模块,显式的学习通道和空间特征,充分利用特征信息。其次,在损失函数环节加入多任务权重学习算法,学习抓取中心坐标、抓手开合宽度及旋转角度信息的最优权重。最后,在Cornell数据集以及更大规模的Jacquard数据集上进行试验。研究结果表明,所提方法相比滑动窗口和锚框类型等经典方法在检测速率上有明显提升,且与单纯的关键点检测方法相比有更高的准确率,所提模型在两个数据集上分别取得98.8%和95.7%的准确率。检测示例体现出所提模型对于非常规物体也有良好的抓取结果,不同Jaccard系数条件下的抓取结果显示模型在精准抓取方面有优秀性能,而对于权重学习算法的不同初始值试验则表明所提模型具有良好的鲁棒性。此外,通过消融实验分析了不同模块对于模型性能表现的影响程度。  相似文献   

8.
为了解决服装变化对行人重识别模型识别人物身份准确率的影响,提出一个基于域增强和域自适应的换衣行人重识别范式,使模型在不同的域中学习通用鲁棒的身份表示特征。首先设计了一种服装语义感知的域数据增强方法,根据人体语义信息,在不改变目标人物身份的情况下,分别改变样本衣服裤子的颜色,生成同人同衣不同色的域数据,填补换衣数据域单一问题;其次设计了一个多正类域自适应损失函数,该函数根据不同域数据在模型训练中所做出贡献的不同,为多正类数据损失赋予不同权重,迫使模型专注于样本的通用身份特征的学习。实验证明,在不影响非换衣行人重识别准确度的情况下,该方法在PRCC和CCVID换衣数据集上的首位命中率和平均精度均值达到了约59.5%、60.0%和88.0%、84.5%。对比于其他方法,这种方法具有更高的准确率和更强的鲁棒性,显著提高了模型识别换衣行人的能力。  相似文献   

9.
10.
命名实体识别是自然语言处理的重要基础,随着神经网络的快速发展,深度学习的各种方法被应用于文本处理的各个方向。引入自注意力机制,结合深度学习方法,提出一种基于自注意力的双向长短期记忆条件随机场(SelfAtt-BiLSTM-CRF)方法来识别微博中的实体,利用自注意力机制,获取词与词之间的依赖关系,进一步提高模型的识别能力。实验表明,所提出的方法取得了较好的识别效果。  相似文献   

11.
12.
车辆识别技术综述   总被引:5,自引:0,他引:5  
车辆识别是智能交通系统的重要组成部分,也是交通管控、无人驾驶、疑犯追踪、行为分析等其他智能任务的基础.首先对车辆识别研究中存在的困难与挑战进行了阐述,在此基础上详细综述了基于浅层学习和深度学习的车辆识别前沿技术研究进展,最后进行了总结与分析,探讨了车辆识别领域目前仍需解决的问题和未来的研究方向.  相似文献   

13.
基于YOLO算法的车辆实时检测   总被引:1,自引:0,他引:1  
目前,基于机器视觉的车辆检测算法存在检测速度较慢的问题。针对该问题,提出一种基于YOLO算法的车辆实时检测方法。YOLO检测算法的基本模型由卷积层,池化层以及全连接层组成,具有强鲁棒性以及能够快速完成车辆检测任务。选择交通监控视频作为数据集进行车辆检测试验。结果表明,YOLO检测算法的查准率为89.3%,查全率为81.0%,检测速度达到60f/s,基本满足交通监控中车辆检测的实时性需求,说明该方法合理可行。运用该方法与2种不同的检测算法进行对比分析,得出YOLO算法的检测速度最快。  相似文献   

14.
品种纯度是谷物种子重要的质量指标,种子质量安全直接关乎国家粮食安全。国标规定的品种纯度鉴定采用形态鉴定法和苯酚染色法,鉴定结果受制于检验人员的经验且耗时较长。近年来,机器视觉技术和机器学习、深度学习算法发展迅速,在谷物品种识别和纯度、净度检测中取得了较大进展。主要从图像采集、图像预处理以及机器学习、深度学习技术在谷物品种识别领域的应用等方面进行归纳,分析了目前取得的研究成果以及存在的问题,对该领域未来研究重点进行了展望。  相似文献   

15.
根据激光雷达检测车辆目标的特点, 提出了一种基于距离的自适应聚类方法, 距离阈值可根据目标与本车的相对距离与方位自动调整, 提高了聚类的准确性.采用一种基于多特征融合的确定性多目标关联方法, 以目标的运动特征为代价方程的主要约束条件, 同时考虑了目标的外形特征, 可提高关联的准确性.针对现有的确定性目标关联方法只能对给定数目的目标进行跟踪的缺陷, 应用一种改进的目标关联方法和跟踪器管理策略, 根据实际道路情况动态地增加和删除跟踪器, 实现了对暂时遮挡或者漏检的目标保持跟踪的连贯性.通过实验验证了本文识别和跟踪方法的有效性.  相似文献   

16.
17.
针对现有的视觉位置识别方法在图像外观变化和视角变化时准确性和鲁棒性表现不佳的问题,提出了一个与注意力机制结合的视觉位置识别方法。首先,采用在大型位置数据集上预训练的卷积神经网络HybridNet提取特征。然后,运用上下文注意力机制对图像不同区域分配权重值,构建基于多层卷积特征的注意力掩码。最后,将掩码与卷积特征结合,构建融合注意力机制的图像特征描述符,从而提高特征的鲁棒性。在两个典型位置识别数据集上做测试实验,结果表明结合注意力机制的方法可以有效区分图像中与位置识别有关的区域和无关的区域,提高在外观变化和视角变化场景中识别的准确性和鲁棒性。  相似文献   

18.
在SAR图像车辆目标检测过程中,车辆轮廓定位不仅能够提供车辆位置信息,而且还能够为车辆状态分析提供依据,是SAR图像理解的关键步骤。但SAR图像中乘性斑点噪声会对轮廓定位造成干扰,增加车辆目标检测的难度。针对这一问题,提出了一种注意力机制的SAR图像像素级车辆目标检测网络。该网络由目标筛选、目标定位和轮廓细化三个模块构成。目标筛选在一个轻量级的特征提取网络中采用通道注意力和自注意力机制,在抑制噪声影响的同时对包含目标图像进行快速筛选,并提供稳定的定位热力图;目标定位利用掩码交叉注意力机制根据定位热力图优化粗尺度特征细化目标定位,并融入细尺度信息改善目标轮廓细节;轮廓细化通过轮廓点筛选消除上采样及噪声带来的轮廓不确定点获取准确的轮廓像素点置信度。对MSTAR数据集进行车辆像素级标注,建立SAR图像车辆数据集及大场景图像数据集用于网络测试。实验结果表明,该网络具有良好的像素级检测性能,可实现大场景SAR图像中车辆目标的快速精确检测。  相似文献   

19.
针对使用不同中间向量遗传策略(学习策略)的差分进化算法所表现出的性能不同,提出一种改进的差分进化算法,对已有的两种遗传策略引入自适应权重,设计了一个新的中间向量遗传策略.通过对基准函数进行测试,结果表明新算法避免了早熟收敛,寻优性能较好,收敛速度较快,具有一定的有效性.  相似文献   

20.
由于现有的车辆重识别方法大多是在已标注车辆边界框的图像间进行的,但在真实场景中无标注信息,同时环境的复杂性、车辆外观的相似性和多样性也是导致重识别精度不高的原因。因此,针对公共安全监控领域中无标注的原始视频,提出一种结合车辆检测与识别的多摄像机车辆重识别方法。首先设计了二值-单点多盒车辆检测网络以获取视频中的车辆边界框,并在线生成候选车辆数据库;其次设计了一种多任务孪生车辆识别网络以提高重识别精度;最后组建“VeRi-1501”车辆数据集。该数据集在现有数据集上扩充车辆身份,并均衡每个车辆身份在不同摄像机下的图像数量。该方法在VeRi-1501数据集和实际交通场景中识别准确且精度高。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号