首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 146 毫秒
1.
为解决在卫星遥感图像的多尺度目标检测中出现的背景混乱、小目标检测精度低、漏检率高等问题,提出一种用于卫星遥感图像的多尺度目标检测算法。在主干网络中使用通道和空间注意力模块,并重新设计特征融合网络,实现上采样-下采样-上采样的多重融合,并在其中加入通道权重参数,让网络更加关注重要的层次,实现不同层次特征信息的充分利用,使细节特征信息得到增强。在DIOR数据集中的实验结果表明,所提算法不仅显著提升对小目标的检测效果,而且提高对复杂场景中目标的检测精度,与YOLOv5m相比,对部分较小或者复杂的目标检测效果提升明显,精度提升4.5个百分点以上,整体精度提升3.1个百分点。  相似文献   

2.
深度学习技术因其强大的特征提取能力而被广泛应用于目标检测任务中。针对多尺度宫颈癌细胞的识别准确率不均衡、检测效率低等问题,本文提出一种基于YOLO v3模型的改进识别算法mo-YOLO v3(mini-object-YOLO v3)。选用20倍数字扫描仪下采集的宫颈细胞图像作为数据集,为提高算法的鲁棒性,引入对比度增强、灰度图、旋转和翻转等多种数据增强策略扩充数据集;模型以Darknet53网络结合注意力机制作为主干模块,针对宫颈癌细胞尺寸差异大的特点,提出一种多尺度特征融合算法来优化模型结构;针对小目标检测精度低的问题,提出一种改进的损失函数,采用相对位置信息的方法减弱物体框对检测结果的影响。测试结果表明,本文所提的mo-YOLO v3模型不仅在总体识别精度上有明显的优势,同时大大提高了小尺寸宫颈癌细胞的定位精度。该模型对宫颈癌细胞识别的准确率达到90.42%,查准率达到96.20%,查全率达到93.77%,相似指数ZSI为94.97%,高于同类算法。  相似文献   

3.
针对轻量化网络在目标检测中检测精度低的问题,提出了一种以MobileNet为基础网络的轻量级目标检测网络MobileNet-RFB-ECA。针对目标多尺度特性,采用基于轻量化扩充感受野模块(RFB)的特征金字塔网络结构增强网络对目标多尺度特性的适应性。与此同时,针对复杂注意力模块导致计算量大的问题,在主干特征提取网络添加有效通道注意力机制模块(ECA),提高卷积神经网络的性能。实验结果表明,相较于MobileNet,所提MobileNet-RFB-ECA在PASCAL VOC数据集和KITTI数据集上检测精度分别提高了4.2个百分点和15.4个百分点,模型大小分别为50.3 MB和48.5 MB,平均检测速度为34 frame·s-1。  相似文献   

4.
本文提出了一种场景文本检测方法,用于应对复杂自然场景中文本检测的挑战。该方法采用了双重注意力和多尺度特征融合的策略,通过双重注意力融合机制增强了文本特征通道之间的关联性,提升了整体检测性能。在考虑到深层特征图上下采样可能引发的语义信息损失的基础上,提出了空洞卷积多尺度特征融合金字塔(dilated convolution multi-scale feature fusion pyramid structure, MFPN),它采用双融合机制来增强语义特征,有助于加强语义特征,克服尺度变化的影响。针对不同密度信息融合引发的语义冲突和多尺度特征表达受限问题,创新性地引入了多尺度特征融合模块(multi-scale feature fusion module, MFFM)。此外,针对容易被冲突信息掩盖的小文本问题,引入了特征细化模块(feature refinement module, FRM)。实验表明,本文的方法对复杂场景中文本检测有效,其F值在CTW1500、ICDAR2015和Total-Text 3个数据集上分别达到了85.6%、87.1%和86.3%。  相似文献   

5.
红外小目标检测因其探测距离远、抗干扰能力强等特点,在空中目标探测与跟踪系统中得到了广泛的应用.针对目前红外小目标检测算法在复杂背景下检测准确率低、虚警率高等缺点.提出了一种基于多尺度特征融合的端到端红外小目标检测模型(multi-scale feature fusion single shot multibox det...  相似文献   

6.
主要介绍了多尺度特征思想以及注意力机制加强卷积特征的方法.首先,基于这一思路提出了多尺度注意力特征方法,并选择在计算机视觉两个子领域——目标检测与视频行为识别上验证方法.其次,在目标检测领域上,通过实验验证注意力机制的有效性,加入多尺度注意力特征的网络模型对目标检测的结果有了进一步提升.最后,在视频行为识别领域,输入网...  相似文献   

7.
人脸检测是指检测并定位输入图像中所有的人脸,并返回精确的人脸位置和大小,是目标检测的重要方向。为了解决人脸尺度多样性给人脸检测造成的困难,该文提出一种新的基于单一神经网络的特征图融合多尺度人脸检测算法。该算法在不同大小的卷积层上预测人脸,实现实时多尺度人脸检测,并通过将浅层的特征图融合引入上下文信息提高小尺寸人脸检测精度。在数据集FDDB和WIDERFACE测试结果表明,所提方法达到了先进人脸检测的水平,并且该方法去掉了框推荐过程,因此检测速度更快。在WIDERFACE难、适中、简单3个子数据集上测试结果分别为87.9%, 93.2%, 93.4% MAP,检测速度为35 fps。所提算法与目前效果较好的极小人脸检测方法相比,在保证精度的同时提高了人脸检测速度。  相似文献   

8.
刘亚灵  郭敏  马苗 《光电子.激光》2021,32(12):1271-1277
针对声音事件检测中仅在时频维度使用注意力机制的局限性以及卷积层单一导致的特征提取不足问题,本文提出基于多尺度注意力特征融合的卷积循环神经网络(convolutional recurrent neural network,CRNN)模型,以提高声音事件检测性能.首先,提出多尺度注意力模块,实现对局部时频单元和全局通道特征...  相似文献   

9.
随着技术的不断发展,遥感技术被广泛应用于地图绘制、资源勘探以及灾害预警等领域。遥感目标检测是进行遥感图像解译的关键步骤。传统的目标检测算法在对遥感目标进行检测的过程中存在目标漏检、检测精度低以及无法解决小目标检测等问题。提出一种基于多尺度特征增强卷积神经网络(MSFE-CNNs)的遥感目标检测算法,通过对不同卷积层特征进行增强和融合,使得模型具有更快的训练速度和更高的检测精度。所提算法结合特征提取模块、特征增强模块、自注意力机制和金字塔特征注意力机制。特征提取模块对输入的海量遥感数据进行特征提取,获取不同类别目标的多尺度特征;特征增强模块用于增强不同卷积层特征相关性,强化模型的学习能力和特征之间的非线性关系;自注意力机制和金字塔特征注意力机制主要解决传统卷积神经网络无法获取小尺度目标特征的问题。为了验证所提算法的有效性,在DOTA数据集上进行不同方法对比,实验结果表明所提算法在检测精度和训练速度上均优于现有基于深度学习的目标检测算法。  相似文献   

10.
王文霞  张文  何凯 《激光与红外》2023,53(9):1364-1374
为提升目标检测算法在复杂环境下的精确性和实用性,将多源信息和深度学习技术相结合,提出了一种基于双模态特征增强的目标检测方法。该方法以红外和可见光图像作为输入,利用颜色空间转换、边缘提取、直方图均衡化等传统图像处理方法丰富图像信息,达到数据增强效果;特征提取部分采用卷积神经网络结构分别提取目标红外及可见光信息,并设计混合注意力机制分别从通道和空间位置角度提升有效特征权重;同时,针对目标双模态信息,引入了自适应交叉融合结构,提高特征多样性;最后,利用交替上下采样将目标全局和局部特征充分融合,并以自主选择方式提取目标相关特征实现检测。通过在标准数据集以及实际场景数据集上的实验结果表明,所提方法有效融合并增强了目标多模态特征,提升了目标检测效果,并能较好的应用于电网场景中,辅助机器人完成目标设备检测。  相似文献   

11.
针对遥感图像在复杂背景下因特征提取和表达能力不足而存在漏检和检测效果不佳的问题,提出一种优化特征提取网络的YOLOv4算法模型。该改进模型引入了一种新的Dense-PANet结构以获取更高的分辨率特征,并通过在特征提取网络中嵌入注意力机制以适应遥感图像因视野范围大而导致复杂背景下小目标漏检和检测效果不佳的问题。为了证明本文所提方法的有效性,针对DIOR遥感数据源进行了对比实验,结果表明,本文算法平均准确率(mean average precision,mAP)为86.55%,相比原算法提高了2.52%,较YOLOv3、RetinaNet提高了6.58%、14.09%,验证了所改进算法的有效性。  相似文献   

12.
卷积神经网络在高级计算机视觉任务中展现出强 大的特征学习能力,已经在图像语义 分割任务 中取得了显著的效果。然而,如何有效地利用多尺度的特征信息一直是个难点。本文提出一 种有效 融合多尺度特征的图像语义分割方法。该方法包含4个基础模块,分别为特征融合模块(feature fusion module,FFM)、空 间信息 模块(spatial information module,SIM)、全局池化模块(global pooling module,GPM)和边界细化模块(boundary refinement module,BRM)。FFM采用了注意力机制和残差结构,以提高 融合多 尺度特征的效率,SIM由卷积和平均池化组成,为模型提供额外的空间细节信息以 辅助定 位对象的边缘信息,GPM提取图像的全局信息,能够显著提高模型的性能,BRM以残差结构为核心,对特征图进行边界细化。本文在全卷积神经网络中添加4个基础模块, 从而有 效地利用多尺度的特征信息。在PASCAL VOC 2012数据集上的实验结 果表明该方法相比全卷积神 经网络的平均交并比提高了8.7%,在同一框架下与其他方法的对比结 果也验证了其性能的有效性。  相似文献   

13.
结合视觉显著性引导与分类器融合的遥感目标检测   总被引:4,自引:1,他引:4  
利用有限计算资源对大视场遥感图像进行快速目标检测有着重要的现实意义。借鉴注意机制在人类视觉系统中的选择性感知特点,结合自底向上的视觉显著性引导及自顶向下的显著区域解译,提出一种新的大视场遥感目标检测模型。设计其整体架构分为注意初期、注视阶段及注意后期3个递进的层级,通过引入一种自适应形态学的显著图生成策略快速搜寻整个视场中的显著区域,并在其引导下利用分类器融合技术从特征属性相似的显著物中区分出任务目标。以大视场遥感图像舰船检测验证模型,性能及对比实验结果表明该模型是可行的,同时实现了计算资源有层次、有重点地合理分配。  相似文献   

14.
针对空中红外目标检测过程中存在的检测精度不高、易受干扰等问题,本文提出了一种信息融合的目标检测算法。首先,针对单一滤波模式的不足,采用降采样方式将多种模式的滤波方法进行融合,有效提高了滤波后的图像信噪比,减少了预处理时间。然后,对质心检测选定的检测区域进行显著性检测和边缘检测,并将结果进行融合,增强了目标区域的信号强度,改善了算法的检测精度。文中从理论上介绍和分析了该算法对红外目标检测的有效性,并通过Matlab仿真实验与其他单一检测算法进行了对比。实验结果表明,信息融合的检测算法能够在多种复杂情况下有效检测出空中红外目标,证明融合检测算法的抗干扰性和适应性上更强、检测精度更高、算法的鲁棒性更好。  相似文献   

15.
针对传统编解码结构的医学图像分割网络存在特征信息利用率低、泛化能力不足等问题,该文提出了一种结合编解码模式的多尺度语义感知注意力网络(multi-scale semantic perceptual attention network,MSPA-Net) 。首先,该网络在解码路径加入双路径多信息域注意力模块(dual-channel multi-information domain attention module,DMDA) ,提高特征信息的提取能力;其次,网络在级联处加入空洞卷积模块(dense atrous convolution module,DAC) ,扩大卷积感受野;最后,借鉴特征融合思想,设计了可调节多尺度特征融合模块 (adjustable multi-scale feature fusion,AMFF) 和双路自学习循环连接模块(dual self-learning recycle connection module,DCM) ,提升网络的泛化性和鲁棒性。为验证网络的有效性,在CVC-ClinicDB、ETIS-LaribPolypDB、COVID-19 CHEST X-RAY、Kaggle_3m、ISIC2017和Fluorescent Neuronal Cells等数据 集上进行验证,实验结果表明,相似系数分别达到了94.96%、92.40%、99.02%、90.55%、92.32%和75.32%。因此,新的分割网络展现了良好的泛化能力,总体性能优于现有网络,能够较好实现通用医学图像的有效分割。  相似文献   

16.
在当前的目标跟踪领域,现有的基于分割的算法没有充分利用目标的长距离依赖信息和各个特征层的不同特性,前背景判别能力不强,对目标的多尺度估计不足。针对此问题,提出了自适应特征融合模块和混合域注意力模块,以提高网络对目标的多尺度估计能力和对目标的前背景辨别能力,并将其集成到当前基于视频分割的算法中,提出了一种新的目标跟踪算法,在各大公开数据集上的实验结果证明其达到了领先水平。  相似文献   

17.
针对自然场景中任意形状文本容易漏检、错检的问题,提出了一种基于双重注意力融合和空洞残差特征增强的场景文本检测方法.为了增强文本特征通道之间的潜在联系,提出了双重注意力融合(DAF)模块,采用双向特征金字塔与双重注意力融合模块相结合的方式进行多层的特征融合;另外针对深层特征图在降维的过程中可能造成语义丢失的现象,提出了空...  相似文献   

18.
Objects that occupy a small portion of an image or a frame contain fewer pixels and contains less information. This makes small object detection a challenging task in computer vision. In this paper, an improved Single Shot multi-box Detector based on feature fusion and dilated convolution (FD-SSD) is proposed to solve the problem that small objects are difficult to detect. The proposed network uses VGG-16 as the backbone network, which mainly includes a multi-layer feature fusion module and a multi-branch residual dilated convolution module. In the multi-layer feature fusion module, the last two layers of the feature map are up-sampled, and then they are concatenated at the channel level with the shallow feature map to enhance the semantic information of the shallow feature map. In the multi-branch residual dilated convolution module, three dilated convolutions with different dilated ratios based on the residual network are combined to obtain the multi-scale context information of the feature without losing the original resolution of the feature map. In addition, deformable convolution is added to each detection layer to better adapt to the shape of small objects. The proposed FD-SSD achieved 79.1% mAP and 29.7% mAP on PASCAL VOC2007 dataset and MS COCO dataset respectively. Experimental results show that FD-SSD can effectively improve the utilization of multi-scale information of small objects, thus significantly improve the effect of the small object detection.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号