首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 156 毫秒
1.
行人检测是利用计算机视觉技术判断图像或者视频序列中是否存在行人并给予精确定位。针对行人检测在密集场景下普遍存在的行人间遮挡问题,提出基于迭代Faster R-CNN的密集行人检测模型,利用一种IterDet迭代方案对Faster R-CNN进行改进,有效解决非极大值抑制(NMS)算法及其改进在选择精确度和召回率之间平衡点的难题。同时利用递归金字塔结构(RFP)进一步增强模型提取特征能力。在具有挑战性的WiderPerson和CrowdHuman数据集上进行训练和验证,实验结果表明,该模型相比Faster R-CNN在精度和召回率显著提升的同时,漏检率也明显降低。尤其在WiderPerson数据集上召回率、精度、漏检率等性能指标分别达到了97.65%、91.29%、40.43%的SOTA结果。  相似文献   

2.
为了解决由于型钢表面缺陷形态多样、微小缺陷众多所带来的检测效率低与检测精度差的问题,提出一种基于可变形卷积与多尺度-密集特征金字塔的型钢表面缺陷检测算法——Steel-YOLOv3。首先,使用可变形卷积代替Darknet53网络部分残差单元的卷积层,从而强化特征提取网络对型钢表面多类型缺陷的特征学习能力;其次,设计了多尺度-密集特征金字塔模块:在原有YOLOv3算法的3层预测尺度上增加1层更浅层的预测尺度,再对多尺度特征图进行跨层密集连接,从而增强对密集微小缺陷的表征能力;最后,针对型钢缺陷尺寸分布特点,使用K-means维度聚类方法优化先验框尺寸并将先验框平均分配到4个对应预测尺度上。实验结果表明:Steel-YOLOv3算法具有89.24%的检测平均精度均值(mAP),与Faster R-CNN(Faster Region-based Convolutional Neural Network)、SSD(Single Shot MultiBox Detector)、YOLOv3和YOLOv5算法相比分别提高了3.51%、26.46%、12.63%和5.71%,且所提算法显著提升了微小剥落缺陷的检出率。另外,所提算法的每秒检测图像数量达到25.62张,满足实时检测的要求,可实际应用于型钢表面缺陷的在线检测。  相似文献   

3.
针对遥感图像目标检测中的漏检错检问题,提出了一种基于特征增强及密集场景优化的目标检测算法。通过对Faster R-CNN框架进行优化,加入特征增强卷积层使得小目标特征更加显著,同时采用改进的非极大值抑制算法对密集场景的目标置信度进行更新,从而提高遥感图像目标检测性能。实验结果表明:该算法在DOTA遥感数据集上与已有方法相比有效提升了目标检测精度。  相似文献   

4.
杨昊  张轶 《计算机应用》2023,(9):2727-2734
针对目标检测中分类和定位子任务分别需要大感受野和高分辨率,难以在这两个相互矛盾的需求间取得平衡的问题,提出一种用于目标检测的基于注意力机制的特征金字塔网络算法。该算法能整合多个不同感受野来获取更丰富的语义信息,以一种更关注不同特征图重要性的方式融合多尺度特征图,并在注意力机制引导下进一步精练复杂融合后的特征图。首先,通过多尺度的空洞卷积获取多尺度感受野,在保留分辨率的同时增强语义信息;其次,通过多级特征融合(MLF)方式将多个不同尺度的特征图通过上采样或池化操作变为相同分辨率后融合;最后,利用注意力引导的特征精练模块(AFRM)对融合后的特征图作精练处理,丰富语义信息并消除融合带来的混叠效应。将所提特征金字塔替换Faster R-CNN中的特征金字塔网络(FPN)后在MS COCO 2017数据集上进行实验,结果表明当骨干网络为深度50和101的残差网络(ResNet)时,平均精度(AP)分别达到了39.2%和41.0%,与使用原FPN的Faster R-CNN相比,分别提高了1.4和1.0个百分点。可见,所提特征金字塔网络算法能替代原FPN,更好地应用在目标检测场景中。  相似文献   

5.
针对多尺度行人检测的问题,本文提出一种基于融合特征金字塔网络(Feature pyramid networks,FPN)和Faster R-CNN(Faster region convolutional neural network)的行人检测算法。首先,对FPN和区域建议网络(Region proposal networks,RPN)进行融合;然后,对FPN和Fast R-CNN进行融合;最后,在Caltech数据集、KITTI数据集和ETC数据集上分别对融合FPN和Faster R-CNN的行人检测算法进行训练和测试。该算法在Caltech数据集、KITTI数据集和ETC数据集上的mAP (mean Average Precision)分别达到69.72%, 69.76%和89.74%。与Faster R-CNN相比,该算法不仅提高了行人检测精度,而且在多尺度行人检测的问题上也获得了较为满意的检测效果。  相似文献   

6.
针对道路场景下各目标尺度复杂导致的检测精度低问题,提出一种面向道路目标的多尺度Faster R-CNN算法.分析数据集标注的面积及长宽比分布以设置合适尺寸的锚框,提高锚框与目标的匹配度,模型对道路小目标的平均精准度提升了13%以上.在Faster R-CNN网络的特征提取部分加入特征金字塔结构,融合不同尺度特征图的信息...  相似文献   

7.
在无人机场景下,目标检测存在样本数量不足、成像视角不同的问题,导致检测精度低。提出一种结合改进特征金字塔网络(FPN)与关联网络的Faster R-CNN目标检测算法。通过在传统FPN结构中以自下而上的特征融合方式提取特征图的语义信息和位置信息,最大程度地保留特征图的多尺度信息。同时利用候选区域之间的形状特征和位置特征构造区域之间的关联特征,并与深度特征相融合进行分类回归,从而充分提取特征图的整体信息,实现目标检测。在PASCAL VOC 2007和NWPU VHR-10数据集上的实验结果表明,相比FPN+Faster R-CNN算法,该算法的交并比和平均检测精度分别提高了10和2.7个百分点,具有较优的目标检测性能。  相似文献   

8.
新型冠状病毒肺炎疫情严重威胁人们的生命安全,对于聚集性人群密度及口罩佩戴情况的监管是控制病毒扩散的重要途经。公共场所具有人流密集且流动性大的特点,人工监测易增加感染风险,而现有基于深度学习的口罩检测算法存在功能及场景单一的问题,不能在多场景下实现多类别检测,同时精度也有待提升。提出Cascade-Attention R-CNN目标检测算法,实现对聚集区域、行人和口罩佩戴情况的自动检测。针对任务中目标尺度变化过大的问题,选取高精度两阶段Cascade R-CNN目标检测算法作为基础检测框架。通过设计多个级联的候选分类-回归网络并加入空间注意力机制,突出候选区域特征中的重要特征并抑制噪声特征,从而提高检测精度。在此基础上,构建聚集性传染风险智能监测模型,结合Cascade-Attention R-CNN算法的输出结果确定传染风险等级。实验结果表明,该模型对于不同场景和视角的多类别目标图片具有较高的准确性和鲁棒性,Cascade-Attention R-CNN算法平均精度均值达到89.4%,较原始Cascade RCNN算法提升2.6个百分点,较经典的两阶段目标检测算法Faster R-CNN和单阶段目标检测框架RetinaNet分别提升10.1和8.4个百分点。  相似文献   

9.
针对复杂场景下合成孔径雷达(Synthetic aperture radar, SAR)图像船舶目标像素尺度差异大和船舶密集排列造成目标漏检的问题,提出一种基于改进YOLOv5的船舶多尺度SAR图像检测算法。对于YOLOv5的颈部网络,采用双向特征金字塔结构(Bi-directional feature pyramid network, BiFPN)提升网络多尺度特征融合能力,并在其自下而上的特征融合支路中,基于深度可分离卷积(Depthwise separable convolution, DSC)和通道MLP构建EC-MLP(Enhanced channel-MLP)模块,从而丰富语义信息,提供更充分的船舶目标上下文特征;引入全局注意力机制(Global attention mechanism, GAM),使网络对输入特征进行针对性提取并运算,减少网络的信息丢失;此外,使用SIoU损失函数进一步提高网络的训练收敛速度和检测精度。在SSDD和HRSID数据集上与其他8种方法(Faster R-CNN、Libra R-CNN、FCOS、YOLOv5s、PP-YOLOv2、YOLOX-s...  相似文献   

10.
为实现绝缘子及其缺陷实时检测,文章以改进的区域卷积神经网络(Faster Region Convolutional Neural Networks,Faster R-CNN)作为基础研究算法,将残差网络和特征金字塔网络相融合作为特征提取网络,使用深度可分离卷积替换原有的普通卷积,引入SE通道注意力模块,同时改进了网络中的激活函数。改进后的Faster R-CNN与普通Faster R-CNN相比,全类别平均正确率(mean Average Precision,mAP)和检测速度都有所提高。  相似文献   

11.
罗晖  贾晨  芦春雨  李健 《计算机应用》2021,41(3):904-910
针对钢轨踏面块状伤损存在的尺度变化大、样本数据集小的问题,提出了基于改进Faster R-CNN的钢轨踏面块状伤损检测方法。首先,基于ResNet-101基础网络结构来构建多尺度特征金字塔(FPN),以实现深、浅层特征信息的融合,从而提高了小尺度伤损的检测精度;然后,采用广义交并比(GIoU)损失解决了Faster R-CNN中回归损失SmoothL1对预测边框位置不敏感问题;最后,提出引导锚定的区域提名网络(GA-RPN)方法,从而解决了区域生成网络(RPN)生成的锚点大量冗余而导致的检测网络训练中正负样本失衡问题。训练过程中,基于翻转、裁剪、噪声扰动等图像预处理方法对RSSDs数据集进行扩充,解决了钢轨踏面块状伤损训练样本不充足问题。实验结果表明,所提改进方法对钢轨踏面块状伤损检测的平均精度均值(mAP)可达到82.466%,相较于Faster R-CNN提高了13.201个百分点,能够更加准确地检测钢轨踏面块状伤损。  相似文献   

12.
针对断层面上血管的多形性和检测过程中出现的采样不均衡的问题,提出一种改进的Libra区域卷积神经网络(R-CNN)的脑动脉狭窄影像学检测算法,用于检测计算机断层扫描血管造影(CTA)图像的颈内动脉和椎动脉狭窄。首先,在目标检测网络Libra R-CNN中以ResNet50为骨干网络,并分别在骨干网络的3、4、5阶段引入可变卷积网络(DCN),通过学习偏移量提取血管在不同断层面的形态特征;然后,将从骨干网络中提取的特征图输入至引入非局部神经网络(Non-local NN)的平衡特征金字塔(BFP)中进行更深度的特征融合;最后,将融合后的特征图输入至级联检测器,并通过提高交并比(IoU)阈值优化最终检测结果。实验结果表明,改进的Libra R-CNN检测算法相比Libra R-CNN算法,在脑动脉CTA数据集中平均准确率(AP)、AP50、AP75和APS分别提升了4.3、1.3、6.9和4.0个百分点;在公开的结肠息肉CT数据集中,AP、AP50、AP75和APS分别提升了6.6、3.6、13.0和6.4个百分点。通过在Libra R-CNN的骨干网络中加入DCN、Non-local NN和级联检测器,进一步融合特征从而学习脑动脉血管结构的语义信息,使得狭窄区域检测结果更精确,且改进算法在不同的检测任务中具有泛化能力。  相似文献   

13.
基于深度特征的目标检测方法Faster R-CNN在火焰检测任务上存在检测效率低的问题,因此提出了基于颜色引导的抛锚策略。该策略设计火焰颜色模型来限制锚的生成,即利用火焰颜色约束锚的生成区域,从而减少了初始锚的数量,提升了计算效率。为了进一步提高网络的计算效率,将区域生成网络中的卷积层替换成掩膜卷积。为了验证所提方法的检测效果,采用BoWFire和Corsician数据集进行验证。实验结果表明,该方法实际检测速度相较于原Faster R-CNN提高了10.1%,BoWFire上该方法的火焰检测F值为0.87,Corsician上该方法的准确度可达99.33%。所提方法可以提高火焰检测的效率,并能够准确检测图像中的火焰。  相似文献   

14.
马耀名  张雨 《计算机应用》2022,42(2):631-637
为了提高高压输电线路巡检效率,提出改进Faster-RCNN的绝缘子检测算法。首先,在特征提取网络中添加具有注意力机制动态选择机制网络(SKNet),从而使网络着重学习与绝缘子特征相关通道;其次,借助滤波器响应归一化(FRN)层替代原批归一化(BN)层,以避免模型陷入梯度饱和区域;最后,使用距离交并比(DIoU)代替原交并比(IoU)方法,以精确表达特征候选区域框位置。对开源航拍绝缘子数据集进行平移、旋转、Cutout和CutMix等操作来进行增强,将数据集扩充到3 000张并从中随机选择2 500张作为训练集,其余500张作为测试集。相较于原Faster-RCNN算法,所提算法平均准确率提高了3.46个百分点,平均召回率提高了2.76个百分点。实验结果表明:所提算法具有较高检测精度和稳定性,可满足电力巡线绝缘子检测应用场景需求。  相似文献   

15.
盛恒  黄铭  杨晶晶 《计算机应用》2019,39(6):1669-1674
针对人员位置相对固定的场景中实时人数统计的管理需求,以普通高校实验室为例,设计并实现了一套基于更快速的区域卷积神经网络(Faster R-CNN)和交并比(IoU)优化的实验室人数统计与管理系统。首先,使用Faster R-CNN模型对实验室内人员头部进行检测;然后,根据模型检测的输出结果,利用IoU算法滤去重复检测的目标;最后,采用基于坐标定位的方法确定实验室内各个工作台是否有人,并将相对应的数据存入数据库。该系统主要功能有:①实验室实时视频监控及远程管理;②定时自动拍照检测采集数据,为实验室的量化管理提供数据支撑;③实验室人员变化数据查询与可视化展示。实验结果表明,所提基于Faster R-CNN和IoU优化的实验室人数统计与管理系统可用于办公场景中实时人数统计和远程管理。  相似文献   

16.
针对车牌检测模型泛化性低,在智慧交通的不同应用场景中复用困难的问题,提出一种自适应置信度阈值的非限制场景车牌检测算法。首先,构建多预测头网络模型,利用分割预测头减少模型复用的预处理工作,利用自适应置信度阈值预测头提升模型的检测能力,并利用多尺度融合机制及边框回归预测头来提升模型的泛化能力;其次,采用可微分二值网络训练方法,利用可微分二值变换联合训练分类置信度及置信度阈值来学习模型参数;最后,利用连通感知非极大值抑制(CANMS)方法提升车牌检测的后处理速度,并引入轻量级网络ResNet18作为特征提取骨干网络,以减少模型参数量,进一步地提高检测速度。实验结果表明,在中国城市停车场数据集(CCPD)的6个不同限制条件特点的场景中,所提算法可获得平均99.5%的准确率与99.8%的召回率,并达到每秒70帧的高效检测速率,优于Faster R-CNN、SSD等锚框类算法的性能;在3个补充场景测试集上,所提算法对不同分辨率、不同拍摄距离、不同拍摄俯仰角等非限制场景下的车牌检测精度均高于90%。可见,所提算法在非限制场景下具备良好的检测性能及泛化能力,可以满足模型复用的要求。  相似文献   

17.
音松  陈雪云  贝学宇 《计算机工程》2021,47(6):271-276,283
Mask RCNN算法在特征提取过程中存在语义信息丢失的问题,而自然场景中的行人具有姿态不同、遮挡和背景复杂等特点,导致算法应用于行人实例分割时检测准确性较差。对此,提出一种改进的Mask RCNN算法。在Mask RCNN网络的Mask分支中增加串联特征金字塔网络(CFPN)模块,对网络生成的多层特征进行融合,充分利用不同特征层的语义信息。在此基础上,执行RoI Align操作生成行人掩膜。仿照COCO数据集,从生活场景中拍摄1 000张图片,自建一个新的行人数据集。基于该数据集的实验结果表明,改进算法较原算法具有更高的检测精确率。  相似文献   

18.
针对航母甲板面舰载机密集易遮挡,舰载机目标难以检测,且检测效果易受光照条件和目标尺度影响的问题,提出了一种改进的更快的区域卷积神经网络(Faster R-CNN)舰载机目标检测方法。该方法设计了带排斥损失策略的损失函数,并结合多尺度训练,利用实验室条件下采集的图片对深度卷积神经网络进行训练并测试。测试实验显示,相对于原始Faster R-CNN检测模型,改进后的模型对遮挡舰载机目标具有良好的检测效果,召回率提高了7个百分点,精确率提高了6个百分点。实验结果表明,所提的改进方法能够自动全面地提取舰载机目标特征,解决了遮挡舰载机目标的检测问题,检测精度和速度均能够满足实际需要,且在不同的光照条件和目标尺度下适应性强,鲁棒性较高。  相似文献   

19.
目标检测作为计算机视觉的任务之一已经成为研究热点问题。目前,基于深度学习的目标检测算法层出不穷,但大多数情况下学者只关心它们的模型架构,而忽视了其训练过程。目标检测网络在训练过程中会存在明显的不平衡问题,导致模型检测性能降低,不能达到预期的最佳效果。不平衡问题主要包括两个层次,分别是特征图层次和目标函数层次。为了能够充分发挥目标检测模型架构的潜力,实现更好的训练过程,提出利用Balanced Feature Pyramid和Balanced L1 Loss两个模块,同时将它们加入到基于ResNet-50-FPN的Faster R-CNN中,目的是解决Faster R-CNN模型在训练过程中存在的特征图层次和目标函数层次的不平衡问题。通过在MSCOCO数据集上验证,实验结果表明平衡后的模型可达到AP是38.5%的结果,比原Faster R-CNN目标检测模型提高了1.1个百分点。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号