首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 734 毫秒
1.
针对多尺度行人检测的问题,本文提出一种基于融合特征金字塔网络(Feature pyramid networks,FPN)和Faster R-CNN(Faster region convolutional neural network)的行人检测算法。首先,对FPN和区域建议网络(Region proposal networks,RPN)进行融合;然后,对FPN和Fast R-CNN进行融合;最后,在Caltech数据集、KITTI数据集和ETC数据集上分别对融合FPN和Faster R-CNN的行人检测算法进行训练和测试。该算法在Caltech数据集、KITTI数据集和ETC数据集上的mAP (mean Average Precision)分别达到69.72%, 69.76%和89.74%。与Faster R-CNN相比,该算法不仅提高了行人检测精度,而且在多尺度行人检测的问题上也获得了较为满意的检测效果。  相似文献   

2.
邓雪亚  肖秦琨 《计算机仿真》2021,38(10):9-14,42
针对Faster R-CNN算法对战场小型目标和遮挡目标的检测存在耗时且检测精度低的问题,提出基于优化候选区域的Faster R-CNN算法.算法使用改进的区域提取网络(Region Proposal Networks,RPN)提取候选区域并通过误差比较的方法优化候选区域,同时,引入排斥损失来优化遮挡目标的候选区域.优化后的候选区域和特征图进入检测网络,完成目标的分类和位置回归.在坦克装甲目标数据集上进行实验,结果表明:与传统检测算法相比,所提算法在检测速率和平均精度方面的性能更优.  相似文献   

3.
张艳  杜会娟  孙叶美  李现国 《计算机工程》2021,47(9):252-258,265
在遥感图像目标检测领域,多数目标检测算法针对小目标检测时效果不佳,为此,提出一种多尺度特征融合的遥感图像目标检测算法。利用SSD算法的基础网络进行特征提取,形成特征图金字塔。设计特征图融合模块,融合浅层特征图的位置信息和深层特征图的语义信息,从而保留丰富的上下文信息。设计冗余信息去除模块,通过卷积操作进一步提取特征图中的特征,并对特征信息进行筛选,以减少特征图融合时带来的混叠效应。在遥感图像数据集NWPU VHR-10上的实验结果表明,该算法的平均检测精度高达93.9%,其针对遥感图像小目标的检测性能优于Faster R-CNN和SSD等算法。  相似文献   

4.
杨昊  张轶 《计算机应用》2023,(9):2727-2734
针对目标检测中分类和定位子任务分别需要大感受野和高分辨率,难以在这两个相互矛盾的需求间取得平衡的问题,提出一种用于目标检测的基于注意力机制的特征金字塔网络算法。该算法能整合多个不同感受野来获取更丰富的语义信息,以一种更关注不同特征图重要性的方式融合多尺度特征图,并在注意力机制引导下进一步精练复杂融合后的特征图。首先,通过多尺度的空洞卷积获取多尺度感受野,在保留分辨率的同时增强语义信息;其次,通过多级特征融合(MLF)方式将多个不同尺度的特征图通过上采样或池化操作变为相同分辨率后融合;最后,利用注意力引导的特征精练模块(AFRM)对融合后的特征图作精练处理,丰富语义信息并消除融合带来的混叠效应。将所提特征金字塔替换Faster R-CNN中的特征金字塔网络(FPN)后在MS COCO 2017数据集上进行实验,结果表明当骨干网络为深度50和101的残差网络(ResNet)时,平均精度(AP)分别达到了39.2%和41.0%,与使用原FPN的Faster R-CNN相比,分别提高了1.4和1.0个百分点。可见,所提特征金字塔网络算法能替代原FPN,更好地应用在目标检测场景中。  相似文献   

5.
准确检测交通标识牌对提高驾驶的安全性具有十分重要的作用,随着深度学习的不断发展完善,基于深度学习的检测算法也应运而生,但这些方法存在检测小目标精度低的问题。针对这一问题,提出一种基于特征融合级联网络的标识牌检测算法。该算法在Faster R-CNN框架的基础上增加了特征融合模块,将网络中提取的浅层特征信息与深层特征信息相融合,这样就能够同时利用深层特征图中语义信息和浅层特征图中小目标的特征信息来检测标识牌。在特征融合网络后级联一个网络来解决特征融合网络误分类。在Tsinghua-Tencent 100k交通标识数据集上进行实验,结果表明该算法对标识牌的检测的平均检测率有明显提升。  相似文献   

6.
针对Faster R-CNN算法对多目标、小目标检测精度不高的问题,本文提出一种基于Faster R-CNN的多任务增强裂缝图像检测(Multitask Enhanced Dam Crack Image Detection Based on Faster R-CNN, ME-Faster R-CNN)方法。同时提出一种基于K-means的多源自适应平衡TrAdaBoost的迁移学习方法(multi-source adaptive balance TrAdaBoost based on K-means, K-MABtrA)辅助网络训练,解决样本不足问题。ME-Faster R-CNN将图片输入ResNet-50网络提取特征;然后将所得特征图输入多任务增强RPN模型,同时改善RPN模型的锚盒尺寸和大小以提高检测识别精度,生成候选区域;最后将特征图和候选区域发送到检测处理网络。K-MABtrA方法利用K-means聚类删除与目标源差别较大的图像,再在多元自适应平衡TrAdaBoost迁移学习方法下训练模型。实验结果表明:将ME-Faster R-CNN在K-MABtrA迁移学习的条件下应用于小数据集大坝裂缝图像集的平均IoU为82.52%,平均精度mAP值为80.02%,与相同参数设置下的Faster R-CNN检测算法相比,平均IoU和mAP值分别提高了1.06%和1.56%。  相似文献   

7.
该文以无人售货机售卖瓶装饮料商品为研究场景,提出一种基于改进 Faster R-CNN 算法的瓶装饮料商品目标检测方法。首先,采用残差网络 ResNet-50 进行特征提取,加深网络对目标特征的提取和学习的深度;然后,根据瓶装饮料商品形态学特征,增加区域建议网络(Regional Proposal Network) 的锚框数量和样式;最后,基于所提出的多维特征图融合网络,增强了网络对小目标的检测性能。实验结果表明,模型训练迭代 10 000 次后的损失值趋于收敛,10 个类别的瓶装饮料商品平均精度值均在 90% 以上,综合检测识别率平均精度均值(MAP)为 93.26%,较改进前的模型测试精度提升 20%,取得良好检测效果。  相似文献   

8.
针对道路场景下各目标尺度复杂导致的检测精度低问题,提出一种面向道路目标的多尺度Faster R-CNN算法.分析数据集标注的面积及长宽比分布以设置合适尺寸的锚框,提高锚框与目标的匹配度,模型对道路小目标的平均精准度提升了13%以上.在Faster R-CNN网络的特征提取部分加入特征金字塔结构,融合不同尺度特征图的信息...  相似文献   

9.
为了能更好地对手机数据接口的缺陷进行检测,提出一种基于Faster R-CNN的检测算法。将Faster R-CNN检测架构中的RoIPooling替换成RoIAlign,解决RoIPooling计算过程中2次量化造成的目标回归位置的偏差。使用ResNet50融合FPN的网络作为特征提取网络,提高模型对小型目标缺陷的检测效果。最后使用测试集进行预测,实验表明本文提出算法的均值平均精度(mAP)达到了91.17%,比使用VGG为特征提取网络时的mAP提高了24.72个百分点,比单独使用ResNet50为特征提取网络的mAP提高了2.58个百分点,因此,本文提出的算法对手机数据接口缺陷检测有显著的效果提升,为手机数据接口缺陷检测提供了一种更有效的检测方法。  相似文献   

10.
王凤随      陈金刚      王启胜      刘芙蓉     《智能系统学报》2022,17(2):276-285
识别多尺度目标是检测任务中的一项挑战,针对检测中的多尺度问题,提出自适应上下文特征的多尺度目标检测算法。针对不同尺度的目标需要不同大小感受野特征进行识别的问题,构建了一种多感受野特征提取网络,通过多分支并行空洞卷积,从高层语义特征中挖掘标签中的上下文信息;针对不同尺度目标的语义特征出现在不同分辨率特征图中的问题,基于改进的通道注意力机制,提出自适应的特征融合网络,通过学习不同分辨率特征图之间的相关性,在全局语义特征中融合局部位置特征;利用不同尺度的特征图识别不同尺度的物体。在PASCAL VOC数据集上对本文算法进行验证,本文方法的检测精度达到了85.74%,相较于Faster R-CNN检测精度提升约8.7%,相较于基线检测算法YOLOv3+提升约2.06%。  相似文献   

11.
在通过嘴部进行人机交互的场景下,外界光线变化、小目标检测的复杂性、检测方法的不通用性等因素给不同场景下嘴部的识别带来了很大困难.该文以不同场景下的人脸图像为数据源,提出了一种基于改进Faster R-CNN的人脸嘴部识别算法.该方法在Faster R-CNN框架中结合多尺度特征图进行检测,首先将同一卷积块不同卷积层输出的特征图结合,然后对不同的卷积块按元素进行求和操作,在输出的特征图上进行上采样得到高分辨率的表达能力更强的特征,从而提高了嘴部这种小目标的检测性能.在网络训练试验中运用多尺度训练和增加锚点数量增强网络检测不同尺寸目标的鲁棒性.实验表明,相比于原始的Faster R-CNN,对嘴部的检测准确率提高了8%,对环境的适应性更强.  相似文献   

12.
针对金属表面缺陷检测中目标尺寸小和特征不清晰导致漏检的问题,提出一种改进YOLOv3的金属缺陷检测算法。在YOLOv3网络结构的基础上,将第11层浅层特征与网络深层特征融合,生成一个新的尺度为104×104特征图层,提取更多小缺陷目标特征。加入DIoU边框回归损失,为边界框提供移动方向以及更准确的位置信息,加快模型收敛。利用K-Means++聚类分析数据集上的先验框尺寸信息,筛选出最优的Anchor Box,使定位更加精准,降低网络损失。将改进后的算法与其他检测算法在NEU-DET数据集上进行检测性能对比。实验分析表明改进后的YOLOv3平均检测速率为31.6?frame/s;平均检测精度为67.64%,比YOLOv3提高了7.49个百分点,相较于Faster R-CNN等算法也有较大的检测精度优势。结论表明,改进后的YOLOv3可以使小缺陷目标的位置信息和精度更加准确。  相似文献   

13.
针对输电线路无人机巡检图像中绝缘子自爆缺陷目标小而难以精准检测的问题,提出一种基于Faster R-CNN和改进的YOLO v3级联双模型的绝缘子自爆缺陷检测算法。首先,利用无人机巡检图像构建绝缘子串缺陷数据集,并对训练图像样本进行翻转预处理,增加样本数量,提高模型泛化能力,避免过拟合;然后,利用Faster R-CNN检测图像中的绝缘子串,再将检测到的绝缘子串图像送入改进的YOLO v3网络进行自爆缺陷的定位。改进的YOLO v3网络是在YOLO v3基础上借鉴FPN的思想,增加特征提取层并进行特征融合,充分利用深层特征和浅层特征;同时采用CIoU Loss函数作为损失函数,以解决边界框宽高比尺度信息。实验结果表明,本文算法在所构建的绝缘子缺陷数据集上的检测准确率达到91.2%,相比Faster R-CNN或YOLO v3等单模型检测算法提升了3.31个百分点以上,能有效实现无人机巡检中绝缘子自爆缺陷的检测,为输电线路智能化巡检故障诊断提供方法支持。  相似文献   

14.
针对计算机断层扫描(CT)影像中肺结节尺寸变化较大、尺寸小且不规则等特点导致的检测敏感度较低的问题,提出了基于特征金字塔网络(FPN)的肺结节检测方法。首先,利用FPN提取结节的多尺度特征,并强化小目标及目标边界细节的特征;其次,在FPN的基础上设计语义分割网络(名为掩模特征金字塔网络(Mask FPN))用于快速准确地分割提取肺实质,作为目标候选区域定位图像;并且,在FPN顶层添加反卷积层,采用多尺度预测策略改进快速区域卷积神经网络(Faster R-CNN)以提高检测性能;最后,针对肺结节数据集的正负样本不平衡问题,在区域候选网络(RPN)模块采用焦点损失函数以提高结节的检出率。所提方法在公开数据集LUNA16上进行实验,结果表明,利用FPN和反卷积层改进的新网络对结节检测效果有一定的帮助,采用焦点损失函数也有一定效果。综合多种改进,当平均每个扫描件的候选结节数为46.7时,所提方法的肺结节检测敏感度指标为95.7%,与其他卷积神经网络方法如Faster R-CNN、UNet等相比,具有较高的敏感性。所提方法能够较好地提取不同尺度上的结节特征,提高CT图像肺结节检测的敏感度,同时对于较小的结节也能有效检测,能更有效地辅助肺癌的诊断治疗。  相似文献   

15.
针对计算机断层扫描(CT)影像中肺结节尺寸变化较大、尺寸小且不规则等特点导致的检测敏感度较低的问题,提出了基于特征金字塔网络(FPN)的肺结节检测方法。首先,利用FPN提取结节的多尺度特征,并强化小目标及目标边界细节的特征;其次,在FPN的基础上设计语义分割网络(名为掩模特征金字塔网络(Mask FPN))用于快速准确地分割提取肺实质,作为目标候选区域定位图像;并且,在FPN顶层添加反卷积层,采用多尺度预测策略改进快速区域卷积神经网络(Faster R-CNN)以提高检测性能;最后,针对肺结节数据集的正负样本不平衡问题,在区域候选网络(RPN)模块采用焦点损失函数以提高结节的检出率。所提方法在公开数据集LUNA16上进行实验,结果表明,利用FPN和反卷积层改进的新网络对结节检测效果有一定的帮助,采用焦点损失函数也有一定效果。综合多种改进,当平均每个扫描件的候选结节数为46.7时,所提方法的肺结节检测敏感度指标为95.7%,与其他卷积神经网络方法如Faster R-CNN、UNet等相比,具有较高的敏感性。所提方法能够较好地提取不同尺度上的结节特征,提高CT图像肺结节检测的敏感度,同时对于较小的结节也能有效检测,能更有效地辅助肺癌的诊断治疗。  相似文献   

16.
马雯  于炯  王潇  陈嘉颖 《计算机工程》2021,47(8):294-300
针对人工分拣垃圾环境差、任务繁重且分拣效率低的问题,为提高垃圾识别与分类的精确度,同时克服垃圾体积小及图像分辨率较低的难题,基于现有深度卷积神经网络模型,提出改进的Faster R-CNN目标检测模型与VGG16及ResNet50卷积神经网络相结合的方法。根据卷积网络的特性,修改Faster R-CNN网络结构,提升小目标检测任务精度,采用Soft-NMS算法替代传统的非极大值抑制算法,并对参数进行敏感分析,确定其参数范围为0.4~0.7。实验结果表明,与传统Faster R-CNN算法相比,该方法平均精确度提高8.26个百分点,综合识别率达到81.77%,且能够减少图像处理时间。  相似文献   

17.
目的 特征融合是改善模糊图像、小目标以及受遮挡物体等目标检测困难的有效手段之一,为了更有效地利用特征融合来整合不同网络层次的特征信息,显著表达其中的重要特征,本文提出一种基于融合策略优选和双注意力机制的单阶段目标检测算法FDA-SSD (fusion double attention single shot multibox detector)。方法 设计融合策略优化选择方法,结合特征金字塔(feature pyramid network,FPN)来确定最优的多层特征图组合及融合过程,之后连接双注意力模块,通过对各个通道和空间特征的权重再分配,提升模型对通道特征和空间信息的敏感性,最终产生包含丰富语义信息和凸显重要特征的特征图组。结果 本文在公开数据集PASCAL VOC2007(pattern analysis,statistical modelling and computational learning visual object classes)和TGRS-HRRSD-Dataset (high resolution remote sensing detection)上进行对比实验,结果表明,在输入为300×300像素的PASCAL VOC2007测试集上,FDA-SSD模型的精度达到79.8%,比SSD (single shot multibox detector)、RSSD (rainbow SSD)、DSSD (de-convolution SSD)、FSSD (feature fusion SSD)模型分别高了2.6%、1.3%、1.2%、1.0%,在Titan X上的检测速度为47帧/s (frame per second,FPS),与SSD算法相当,分别高于RSSD和DSSD模型12 FPS和37.5 FPS。在输入像素为300×300的TGRS-HRRSD-Dataset测试集上的精度为84.2%,在Tesla V100上的检测速度高于SSD模型10%的情况下,准确率提高了1.5%。结论 通过在单阶段目标检测模型中引入融合策略选择和双注意力机制,使得预测的速度和准确率同时得到提升,并且对于小目标、受遮挡以及模糊图像等难目标的检测能力也得到较大提升。  相似文献   

18.
针对传统山顶点识别方法中特征选择困难等问题,借助深度卷积神经网络特征自学习的优势,将格网DEM数据中的山顶点提取转换为数字图像中的目标检测问题,提出一种基于改进Faster R-CNN的山顶点识别方法;将DEM数据处理为等高线图与灰度图叠加的形式,采用基于Faster R-CNN的目标识别框架,以ResNet-101替代原始的VGG16作为山顶识别模型的特征提取网络,并在RPN锚框尺寸设置中引入K-Means聚类算法,实现适用于自建山顶样本集PEAK-100的锚框参数设定;利用改进后的Faster R CNN自动提取山顶的深度特征,生成高质量的山顶区域,并结合高程标识出最终的山顶点坐标;实验结果表明,新方法的山顶点识别准确率为94.82%,相比于传统方法漏提率减少约60%,在一定程度上避免了山顶识别效果易受人工选择特征的影响.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号