首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 191 毫秒
1.
针对大规模拥挤场景视频中行人目标小、行人遮挡和行人交叠而导致的检测困难等问题,本文将逐像素预测目标检测框架—全卷积单阶段目标检测FCOS(fully convolutional one-stage object detection)应用于行人检测,提出一种改进的主干网络用于提取行人特征,通过增加尺度回归实现目标行人的多尺度检测,同时减少其他特征层检测的目标数量,进而提升行人检测的能力。在拥挤行人场景数据集CrowdHuman和小目标行人数据集Caltech上的大量实验结果表明,和目前先进的方法相比,本文的方法对行人的检测精度有所提升,特别是对于小目标行人检测。与原始FCOS算法相比,在CrowdHuman上平均精度提升接近15%,丢失率降低接近33.0%;在Caltech上的平均精度提升2%。在复杂拥挤场景下的实际应用也证明本文方法的有效性。  相似文献   

2.
针对现有的多尺度目标检测模型在面对尺度变换和遮挡场景时所使用的融合方法融合不充分,且没有捕捉长距离依赖关系的问题,本文设计了通道融合增强模块和非局部特征交互模块,用于学习不同通道特征之间的相关性和捕捉特征图之间的长距离依赖关系。此外,针对当前检测架构都是基于单金字塔检测结构,存在信息丢失的情况,设计了双金字塔结构,并将提出的融合方法与双金字塔结构结合,在保留原始特征信息的基础上,补充融合后的特征信息。实验结果表明,提出的方法在公共数据集KITTI与PASCAL VOC上与其他先进工作相比具有更高的检测精度,证明了该方法在目标检测任务中的有效性。  相似文献   

3.
针对工件表面图像中划痕缺陷尺寸比例异常、尺度变换大、背景纹理复杂等问题,提出一种基于无锚框关键点的工件表面缺陷检测算法AFKPDD。为提高尺寸比例异常的细长划痕的检测精度,采用基于RepPoints Head的检测模块,更好拟合缺陷形态并提取有效特征。为改善尺度变换和背景复杂问题,使用可变形卷积多尺度网络提取图像特征。为提高模型泛化能力,设计随机遮挡数据增强方法和多任务学习策略。自建铝制工件内壁数据集,AFKPDD算法在该数据集上AP达到88.9%,优于其它主流目标检测算法。在公开钢材表面数据集上验证了模型的泛化能力和在划痕检测上的应用价值。  相似文献   

4.
针对输电线路无人机巡检图像中绝缘子自爆缺陷目标小而难以精准检测的问题,提出一种基于Faster R-CNN和改进的YOLO v3级联双模型的绝缘子自爆缺陷检测算法。首先,利用无人机巡检图像构建绝缘子串缺陷数据集,并对训练图像样本进行翻转预处理,增加样本数量,提高模型泛化能力,避免过拟合;然后,利用Faster R-CNN检测图像中的绝缘子串,再将检测到的绝缘子串图像送入改进的YOLO v3网络进行自爆缺陷的定位。改进的YOLO v3网络是在YOLO v3基础上借鉴FPN的思想,增加特征提取层并进行特征融合,充分利用深层特征和浅层特征;同时采用CIoU Loss函数作为损失函数,以解决边界框宽高比尺度信息。实验结果表明,本文算法在所构建的绝缘子缺陷数据集上的检测准确率达到91.2%,相比Faster R-CNN或YOLO v3等单模型检测算法提升了3.31个百分点以上,能有效实现无人机巡检中绝缘子自爆缺陷的检测,为输电线路智能化巡检故障诊断提供方法支持。  相似文献   

5.
实时精准的交通标志检测是实现自动驾驶和智能交通的重要技术之一.针对真实智能驾驶场景中背景复杂且交通标志尺度较小,现有的检测方法容易出现错检和漏检等问题,提出一种尺度感知的双向特征金字塔网络,实现复杂交通场景中实时、精准的交通标志检测.首先,为解决微小标志在传统金字塔网络中尺度丢失的问题,通过构建自底向上和自顶向下的双向金字塔网络,循环地学习尺度感知的融合特征;然后引入前景注意力模块和尺度感知损失函数,学习和优化不同尺度下的前景显著特征和关联,实现多尺度前景目标分离;最后,引入轻量级和非轻量级主干卷积网络,可以同时提高模型效率和精度.在真实复杂场景的交通标志数据集TT100K和STSD中的实验结果表明,该方法的检测精度达到了66.7%和60.9%,同时实时检测速率达到了30帧/s.  相似文献   

6.
针对工业场景下带钢表面缺陷样本少、缺陷尺寸大小不一等问题, 提出一种适用于小样本条件下的带钢表面缺陷检测网络. 首先, 算法以YOLOv5s框架为基础, 设计一种融合注意力机制的多尺度路径聚合网络作为模型的颈部, 增强模型对缺陷目标的多尺度预测能力; 其次, 提出一种自适应解耦检测结构, 缓解小样本情况下分类和定位任务之间的矛盾; 最后, 提出一种融合Wasserstein距离的边界框回归损失函数, 提升模型对小目标缺陷的检测精度. 实验表明, 在构建的小样本带钢表面缺陷数据集上, 本文模型的检测性能优于其他小样本检测模型, 更适用于工业环境下的小样本缺陷检测任务.  相似文献   

7.
针对人体运动目标的实时检测与定位问题,采用深度学习的方法进行研究.在Caffe框架下,采用SSD (Single Shot multibox Detector)检测方法.以VGG16作为基础网络模型,增加额外特征卷积层,提取多尺度的卷积特征.然后对实验数据集进行迭代训练,得到运动目标检测模型.利用训练好的模型,通过2路摄像机检测运动目标,并双目视觉定位.实验结果表明,整个系统运行速度可达40 fps,在10 m×10 m的场景下,平均定位误差在6 cm以内,在速度和精度上均有很好的表现,为大中型场景的人体运动实时检测定位问题提供了有效的解决方案.  相似文献   

8.
基于特征金字塔网络的目标检测算法没有充分考虑不同目标间的尺度差异以及跨层特征融合过程中高频信息损失问题,使网络无法充分融合全局多尺度信息,导致检测效果不佳.针对这些问题,提出了尺度增强特征金字塔网络.该方法对特征金字塔网络的侧向连接和跨层特征融合方式进行了改进,设计具有动态感受野的多尺度卷积组作为侧向连接来充分提取每一个目标的特征信息,引入基于注意力机制的高频信息增强模块来促进高层特征与底层特征融合.基于MS COCO数据集的实验结果表明,该方法能有效提高各尺度目标的检测精度,整体性能优于现有方法.  相似文献   

9.
不同型号手机的主板图像具有多分辨率的成像模式,使缺陷元件是多尺度的。常规缺陷检测方法主要有图像融合方法和提取统计模型的方法,但这些方法的鲁棒性仍需要提高。针对该问题,提出了一种自动检测网络模型,即RetinaNet目标检测器。首先使用特征金字塔网络(FPN)提取缺陷元件的多尺度特征分类和位置,然后引入MobileNetV2以压缩和加速RetinaNet模型,最后使用焦点损失解决类不平衡和难以检测样本对损失贡献程度的问题。实验结果表明, RetinaNet能有效地检测不同尺度的缺陷元件,具有很高的检测精度;与其他目标检测器相比,RetinaNet实现了超过95%的平均精度(mAP)。这些结果表明了本文所提模型的有效性。  相似文献   

10.
针对多尺度目标检测准确率偏低的问题,提出了一种基于YOLOv5s改进的多尺度目标检测算法。在YOLOv5s主干网络与Neck网络之间融合CBAM模块,增强模型对多尺度目标重要特征信息的提取能力;同时,在模型的Head部分增加多尺度目标检测结构,提高不同尺度目标检测精度;训练时采用CIoU替代GIoU损失函数,以提高模型收敛能力,实现高精度目标定位。数据集来源于实际场景中采集并增强的4万余张图像。实验结果表明,改进后的模型对行人、车辆和人脸的多尺度目标检测平均精度达92.1%,相比未改进YOLOv5s算法提升了3.4%。模型的收敛性好,对密集场景的目标,小尺度目标检测准确度更加突出。  相似文献   

11.
YOLOv5是目前单阶段目标检测性能较好的算法,但对目标边界回归的精确度不高,难以适用对预测框交并比要求较高的场景。基于YOLOv5算法,提出一种对硬件要求低、模型收敛速度快、目标框准确率高的新模型YOLO-G。改进特征金字塔结构(FPN),采用跨层级联的方式融合更多的特征,一定程度上防止了浅层语义信息的丢失,同时加深金字塔深度,对应增加检测层,使各种锚框的铺设间隔更加合理;其次把并行模式的注意力机制融入到网络结构中,赋予空间注意力模块和通道注意力模块相同的优先级,以加权融合的方式提取注意力信息,使网络可根据对空间和通道注意力的关注程度得到混合域注意力;通过降低网络的参数量和计算量对网络进行轻量化处理,防止因模型复杂度提升造成实时性能的损失。使用PASCAL VOC的2007、2012两个数据集来验证算法的有效性,YOLO-G比YOLOv5s的参数量减少了4.7%,计算量减少了47.9%,而mAP@0.5提高了3.1个百分点,mAP@0.5:0.95提高了5.6个百分点。  相似文献   

12.
针对通用深度学习目标检测技术难以在高压输变电线路巡检时实现实时高效的故障检测,提出一种改进CenterNet的高压输变电线路巡检故障实时检测方法,对绝缘子自爆、防震锤脱落、鸟巢三类常见巡检故障进行检测。该方法基于深层特征融合网络(DLAnet,Deep Layer Aggregation)、挤压-激励SE(Squeeze-and-Excitation)模块、可形变卷积进行高效深层特征提取网络DLA-SE的设计。在CenterNet架构下通过DLA-SE特征提取网络获取对象的中心点热力图,回归对象的宽高、偏移信息,得到对象边界框。实验结果表明,在Nvidia GTX 1080测试条件下该方法的mAP达到0.917,推理速度达到27.03?frame/s,与CenterNet、SSD与YOLOv3方法相比在检测精度上取得大幅度提升,证明了该方法的有效性。  相似文献   

13.
在易燃易爆场合火灾控制中火焰极速检测意义重大,其对算法实时性、准确度、抗干扰性有较高要求。为此提出一种基于改进YOLOv4-tiny轻量化抗干扰火焰检测深度网络。引入类火目标图像与真实火焰图像并通过Mosaic数据增强方式建立鲁棒性火焰检测数据集;对YOLOv4-tiny骨干网络采用深度可分离卷积进行改进,使得原网络更加轻量化;在特征金字塔网络FPN(feature pyramid network)中融合多尺度特征提高网络对多层特征的学习表示能力,并引出多检测头以适应火焰爆发过程中不同尺度火焰的精准检测;在FPN中引入ECA(efficient channel attention)通道注意力机制进一步提高检测精度。实验结果表明,提出的YOLOv4-tiny-L4参数量仅为4.22?MB,准确率高达94.1%,执行时间仅为46?ms,满足火焰快速检测基本要求。  相似文献   

14.
陈鹏  李鸣  张宇  王志鹏 《测控技术》2022,41(7):17-22
提出了一种结合卷积神经网络和递归神经网络的有效的端到端场景文本识别方法。首先使用特征金字塔(FPN)提取图像的多尺度特征,然后将引入残差网络(ResNet)的深度双向递归网络(Bi-LSTM)对这些特征进行编码,获得文本序列特征,进而引入注意力机制(Attention)对文本序列特征进行解码达到识别效果。在ICDAR2013、ICDAR2015数据集实验验证了该算法的有效性,该方法不仅降低了训练难度,而且提升了网络的收敛速度,提高了文本识别准确率。该方法的有效性在ICDAR2013、ICDAR2015数据集上得到了充分验证。  相似文献   

15.
针对目前工业裂缝分割算法存在细小裂缝易丢失、孤立噪点难消除的问题,提出一种基于可逆金字塔和平衡注意力的工业裂缝分割网络(reversible pyramid and balanced attention network,RPBAN)。提出可逆金字塔模块,在编码器与解码器之间引入特征金字塔和改进后的倒-特征金字塔,加深全局特征与细节特征的融合,从而提升细小裂缝检测性能;在解码阶段引入平衡注意力模块,将平衡特征作为引导信息,有效消除孤立噪点;在学习阶段选取Focal Loss作为损失函数,控制正负样本在训练中所占的权重,使得模型更专注于裂缝样本。通过在自建的输配电线路瓷瓶裂缝数据集InsulatorCrack和三个具有挑战性的公开裂缝数据集CFD、CrackTree200和AEL上进行验证和测试,实验表明与其他基准方法相比,RPBAN提升了细小裂缝检测效果,有效消除了孤立噪点,能够实现更高精度的语义分割。在四个数据集上IoU分别达到61.42%、58.36%、64.45%、53.44%,说明了RPBAN的有效性和通用性。  相似文献   

16.
针对多尺度行人检测的问题,本文提出一种基于融合特征金字塔网络(Feature pyramid networks,FPN)和Faster R-CNN(Faster region convolutional neural network)的行人检测算法。首先,对FPN和区域建议网络(Region proposal networks,RPN)进行融合;然后,对FPN和Fast R-CNN进行融合;最后,在Caltech数据集、KITTI数据集和ETC数据集上分别对融合FPN和Faster R-CNN的行人检测算法进行训练和测试。该算法在Caltech数据集、KITTI数据集和ETC数据集上的mAP (mean Average Precision)分别达到69.72%, 69.76%和89.74%。与Faster R-CNN相比,该算法不仅提高了行人检测精度,而且在多尺度行人检测的问题上也获得了较为满意的检测效果。  相似文献   

17.
无人机航拍图像目标较小、图像视角变化大,导致目标检测效果不佳。针对此问题,设计了一种适用于无人机小目标检测的网络。该网络中的可变形卷积模块可以提高多视角目标的特征提取能力,以解决航拍图像目标视角变化剧烈致使目标特征难以提取的问题;特征平衡金字塔模块可以增强网络中底层小目标特征,以解决航拍图像中的小目标因特征易丢失而造成其检测效果差的问题;同时利用像素重组构建底层大尺度特征以解决特征平衡金字塔模块的底层特征卷积运算量大的问题;交叉自注意力机制获取目标上下文信息,改善严苛条件下的漏检错检问题。公开数据集上的仿真结果表明,在保证实时检测的情况下所提算法的平均准确度优于主流检测算法。  相似文献   

18.
基于无锚点的单阶段全卷积目标检测算法(FCOS)无需生成大量的锚点避免了样本不平衡问题,但FCOS可能更适应于某一特定场景。为了增强特征融合,并提高目标检测的准确性,提出了全卷积目标检测算法FCOS的改进算法ConFCOS。该算法设计了一个增强的特征金字塔网络,引入带有全局上下文信息的注意力模块和空洞卷积模块,以减少特征融合过程中的信息衰减。另外,构建了一个级联检测头来检测对象,对检测的边界框进行细化来提高分类和回归的置信度。此外,针对提出的ConFCOS的损失函数进行了优化以提高目标检测的准确率。在COCO数据集上进行的实验表明,ConFCOS的准确度比FCOS提高了1.6个百分点。  相似文献   

19.
图像篡改检测不同于目标检测,篡改检测更加关注篡改伪像这一目标而非图像内容本身,需要学习更加丰富的特征.为提高图像篡改检测区域选取性能,提出一种将特征金字塔网络(feature pyramid networks, FPN)模型与级联区域卷积神经网络(cascade region-convolutional neural networks, Cascade R-CNN)模型相结合的FCR-CNN模型.首先将FPN模型提取的多尺度篡改特征输入到区域建议网络(region proposal network, RPN),然后由RPN输出篡改分类分数和区域建议框,最后将区域建议框输入到3阶段Cascade R-CNN进行检测.此外,系统地对FCR-CNN模型的损失函数进行了分析.基于CASIA, Columbia和NC2016数据集,与其他算法进行对比实验,结果表明, FCR-CNN模型能够有效地检测与定位篡改区域;其中,在CASIA数据集上,其与FPN模型和Cascade R-CNN模型相比, F1分数分别提高了6.0%和7.5%.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号