首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 218 毫秒
1.
针对传统的前景检测方法在复杂场景下存在精度低、速度慢且不能有效检测目标动作轮廓等问题,本文主要对改进的Mask R-CNN 的游泳池溺水检测进行研究.采用实例分割网络Mask R-CNN进行检测与分割,实现溺水检测,在Mask分支引入空间注意力引导模块,设计了深度注意力分割模型SAG-Mask R-CNN,并在训练Ma...  相似文献   

2.
针对复杂工程场景常用的行人检测方法(尤其在小目标检测方面)精度低、复杂度高的问题,提出一种基于YOLOv5网络的改进识别方法。在骨干网络与颈部网络引入ECA注意力机制,提升模型对通道特征的关注度以抑制背景噪声;使用加权双向特征金字塔结构BIFPN对颈部网络进行修改,加强模型对不同尺度特征融合;使用Ghost模块替换骨干网络与颈部网络的部分卷积,减少模型参数、缩小体积。结果表明:提出的改进模型检测精度达到了88.4%,同时,模型的复杂度(参数量与模型大小)仅为13.5×106与6.67 MB;与目前主流的深度学习方法相比,该算法在检测精度与复杂度上具有更好的性能,在复杂的场景下具有较好的识别效果。  相似文献   

3.
在复杂自然场景下,苹果目标因具有成簇生长、重叠果实和光线变化大等特点,应用深度学习方法相比传统方法来实现果实的识别优势明显.提出基于Mask R-CNN网络检测分割架构,采用膨胀卷积的优化策略,通过候选框与像素分割相结合的思路,同时对输入苹果图像进行目标果实的识别.实验结果表明,基于Mask R-CNN框架改进的网络模...  相似文献   

4.
针对卷积神经网络中间特征层信息利用不充分,以及不区分尺度和难易样本的学习所导致的文字检测精度难以提高的问题,提出基于多路精细化特征融合的聚焦难样本的区分尺度的自然场景文字检测方法. 构建多路精细化的卷积神经网络融合层提取高分辨率特征图;按照文字标注矩形框的较长边的尺寸,将文字实例划分为3种尺度范围,并分布到不同的候选框提取网络中提取相应的候选框;设计聚焦损失函数对难样本进行重点学习以提高模型的表达能力并得到目标文字框. 实验表明,所提出的多路精细化特征提取方法在COCO-Text数据集上的文字召回率较高,聚焦难样本的区分尺度的文字检测方法在ICDAR2013、ICDAR2015标准数据集上的检测精度分别为0.89、0.83,与CTPN、RRPN等方法相比,在多尺度多方向的自然场景图像中具有更强的鲁棒性.  相似文献   

5.
针对堆叠汽车零件识别检测与分割速度慢、精度低及鲁棒性差等问题,提出一种基于改进Mask R?CNN算法对堆叠汽车零件快速检测与实例分割的方法. 首先,对Mask R?CNN中的特征提取网络进行优化,将ResNet + 特征金字塔网络(Feature Pyramid Networks,FPN)替换成MobileNets + FPN作为骨干网络,有效减少网络参数并压缩模型体积,提高模型检测的速度;然后,通过在Mask R?CNN的ROI Align结构后加入空间变换网络(Spatial Transformer Networks,STN)模块,保证模型的检测精度. 试验结果表明,改进后压缩了模型的尺寸,识别检测速度提升了1倍;模型的平均精度均值(Mean Average Precision,mAP)较改进前也有所提升. 对未经训练的新样本进行检测,结果表明该模型速度上优于Mask R?CNN,且更轻量和精准,能够快速准确地实现对堆叠汽车零件检测与分割,验证了改进模型的实际可行性.  相似文献   

6.
由于现有的烟雾检测方法大多依靠手工选取特征,往往不能准确地分割出视频图像中的烟雾区域。基于此,提出了改进的DeeplabV3烟雾分割算法。改进的算法在基础编码器网络后添加了特征细化模块来削弱空洞卷积带来的网格效应;针对烟雾这类尺度和姿态多变的非刚性目标,在带有空洞卷积的空间金字塔模块中引入可变形卷积来更好地学习烟雾的形变;为了进一步恢复烟雾的空间细节,提出了通道注意力解码器模块。在烟雾图片数据集的测试下,改进后的模型平均每张图片的预测时间约达到71.73ms,平均像素精确度约达到97.78%,平均交并比约达到91.21%,精度与DeeplabV3模型相比分别提高了0.56%及2.17%,更加适用于烟雾分割。公开的烟雾视频测试结果表明,该模型的检测率高于现有的视频烟雾检测算法,具有一定的实用价值。  相似文献   

7.
针对目前存在的复杂交通场景中车辆分割精度不足的问题,本文提出了一种基于全卷积神经网络对图像中车辆进行分割的方法。在VGG16Net基础上,将全连接层改为卷积层,为获得更精细的边缘分类结果,减少了部分卷积层,并融合浅层和深层特征,同时,为提高交通环境下车辆的分割精度,减少其他类别目标的干扰,将对车辆目标的分割问题改为基于像素的二分类问题,为提高网络的训练速度,采用Adam优化算法对网络进行训练。实验结果表明,与现有的全卷积神经网络分割效果相比,该网络对复杂交通场景下的车辆分割精度明显提高。该研究在智能交通方面具有较好的应用前景。  相似文献   

8.
为强化智能制造场景中机器人对工件的快速识别性能,从改进 YOLOv4 模型入手作了方法优 化研究。 首先,利用 Ghost 模块优化主干提取网络,以减少网络参数,提高网络检测速度;其次,引入 DRConv 卷积优化特征提取网络,以弥补对主干网络进行优化所造成的精度损失;最后,引入 GAM 注意力模块,以强化在光线不足条件下的适应性。 通过对 YOLOv4 模型的改进,在保证较高识别精 度和检测速度的同时,使模型规模得以简化,使工件快速识别网络趋于轻量化。  相似文献   

9.
为提高工作场所安全帽佩戴的检测精度,提出一种基于YOLOv7网络架构的改进算法。首先,在特征提取网络中引入卷积块注意力机制(CBAM)取代YOLOv7中主干网络部分原有的卷积模块(CBS),增强网络的特征提取能力,加强网络对目标和背景的分辨能力;其次,为解决由于网络层数的加深导致小目标特征减弱甚至消失的问题,增加一个小目标层,通过将浅层网络特征与深层网络特征融合,进一步保留小目标特征。实验结果表明,原YOLOv7对安全帽佩戴检测的均值平均精度为86.1%,改进后到达93.4%,实现了检测精度的提高。  相似文献   

10.
红外图像中变电设备的分割精度直接影响着故障诊断的结果,针对复杂红外背景下变电设备边缘分割不精细、分割精度低的问题,提出了一种基于改进Mask R-CNN模型的变电设备红外图像分割方法。首先将ResNet特征提取网络中部分残差模块的标准卷积替换为可变形卷积,然后对空间注意力机制模块和通道注意力机制模块并行连接,并在这两个模块中加入可变形卷积,最后改进Mask R-CNN掩膜分支的损失函数,对目标边缘分割的精细度进一步优化。该方法能够有效提高模型对红外图像中变电设备几何特征多样性的适应能力,并减轻模型对背景等干扰特征的关注。在变电设备红外图像数据集上进行实验,结果表明,相比于Mask R-CNN基准模型,该方法的AP50:95、AP50和AP75提高了3.5%、1.0%、4.2%,表明该方法能够显著提高红外图像中变电设备实例分割的准确率,有效解决边缘分割不精细的问题。  相似文献   

11.
在特征词提取算法中,TF-IDF算法是最常见的特征权重计算方法。在传统TF-IDF算法的基础上,提出新的基于文本词语长度的关键词提取算法。利用中文短语分词技术,识别文本中的长词与普通词汇,对于不同长度的词语利用提出的TF-IDF-WL方法重新计算权重,按权值排序结果得到关键词。实验对比发现,新的特征词提取算法能够更加精确地反映出特征词的词长情况,该算法与传统的TF-IDF算法相比,在准确率和召回率上都有较大的提升。  相似文献   

12.
针对基于语义分割的车道线检测方法存在的特征表述模糊、语义信息利用率较低的问题,采用实例分割算法,提出基于改进混合任务级联(HTC)网络的车道线检测方法. 基于HTC网络模型,在主干网络中引入可变形卷积,提升主干网络对复杂环境中车道线特征的提取能力. 改进特征金字塔网络结构,在特征金字塔网络的基础上添加自底向上的低层特征传递路径,引入空洞卷积,在不损失车道线特征信息的情况下增加特征图感受野,利用低层特征中所包含的车道线的精确定位信息,提高车道线的检测精度. 实验结果表明,改进HTC网络模型可以实现车道线特征的鲁棒提取,在复杂道路环境中可以获得较好的检测性能,有效提高了车道线检测精度.  相似文献   

13.
视觉SLAM(simultaneous localization and mapping)是智能车辆领域的研究热点,在包含运动目标干扰或近景特征不显著的场景中,容易产生帧间位姿估计结果精度不足或失效问题.为此,本文提出一种结合场景语义信息和路面结构化特征的SLAM算法.首先,针对上述特殊场景中运动目标干扰的情况,设计带有改进金字塔池化模块的语义分割神经网络,得到图像中各像素对应的目标类别,作为剔除运动像素点的依据,从而避免运动点参与特征匹配导致的位姿计算准确性下降问题;然后,针对有效近景特征点不足的情况,基于V视差算法确定图像中的道路平面区域并拟合出精确的视差方程,以计算路面上像素点的精确视差值,并提出一种基于路面结构化特征(车道线、马路边界、路面交通标记等)的位姿计算方法;最后通过场景实验得出,本文提出的改进算法计算结果的绝对轨迹误差小于原算法.证明该方法能够在存在运动目标干扰或缺乏近景特征的场景中具有较高的位姿估计精度,建立了有效的包含语义信息的稠密点云地图,具有良好的环境适应性.  相似文献   

14.
针对现实场景图片中的文字区域具有仿射变换和多方向的问题,设计了一种带有仿射变换锚点,能够生成仿射变换文本预测框的文本检测网络。按照常见文字实例的仿真变换形状,给定了6种固定角度和5个固定变换量。检测过程中对预测候选框的角度和偏移值进行了调整拟合,最后对边框进行了回归,让检测结果更适应真实文字区域的边界框。与以往的文字检测网络相比,该检测方法能够有效适应文字区域,在检测精度和平均指标上分别有了7%和10%的提升。  相似文献   

15.
针对道路场景检测忽略法线属性的问题,为了加强对空间上下文和边缘信息的利用,提出结合空间上下文算法的道路场景法线区域分割方法,将道路场景识别为路面和障碍物分别对应的水平区域和竖直区域. 在交叉熵损失函数的基础上添加障碍物增强损失,改善训练过程不同分类的权重分配,提高小区域障碍物识别率. 提出上下文改进算法优化位置关联图的矩阵计算方式,减少空间复杂度提高运算效率. 嵌入边缘上下文模块削减噪声并强化主要边缘,加强边缘信息的利用. 在自建数据集和Cityscapes数据集的实验结果表明,与主流的语义分割方法相比,本研究方法加强网络特征提取能力,能有效提高对道路法线区域的分割准确度,相较Deeplab, 交并比提高了2.1%,能简单有效地实现避障任务.  相似文献   

16.
针对提高快递包裹的分拣效率和识别准确率,提出了一种基于深度神经网络复杂场景下的机器人拣选方法.首先,提出一种改进的目标检测算法,通过将多层浅层特征图与最终的特征图进行融合,提取更加细节的特征,以提升识别的速度与精度;其次,提出了一种基于关键点的级联卷积最优拣选位置检测网络模型,对包裹最优拣选位置进行实时预测估计;最后,结合目标包裹最优拣选框与场景的深度信息和基于三维信息的目标姿态估计算法实现机器人拣选,并通过实验验证了该方法的有效性.  相似文献   

17.
基于注意力机制和多层次特征融合的目标检测算法   总被引:1,自引:0,他引:1  
为了提高目标检测的准确率,提出一种基于注意力机制和多层次特征融合的图像目标检测算法。该算法在Cascade R-CNN模型的基础上,以RseNet50为主干网络,通过嵌入简单的注意力模块(SAM)来提高网络的判别能力;其次,利用深度可分离卷积改进特征金字塔网络(FPN),设计了多层次特征融合模块(MFFM),对多尺度特征进行融合,以丰富特征图的信息量,并对不同层次的特征图赋予相应的权重以平衡不同尺度的特征信息;最后,结合目标检测方法中的区域建议网络(RPN)结构获取目标的候选区域进行分类和回归处理,确定检测目标的位置和类别。实验结果表明,相较于Cascade R-CNN目标检测算法,该算法的检测精度提升了约2.0%。  相似文献   

18.
利用印刷电路板(PCB)残片图像的字符检索完整PCB图像,是解决PCB残片溯源难题的一种有效方法;为此,提出了一种高性能的PCB图像字符检测方法。基于残差网络结构实现特征金字塔的提取,设计双检测头进行字符区域预测,引入结构相似性损失函数优化网络;设计了一种适合PCB图像的字符区域热力图标签生成算法以训练网络;采用多种数据增强、多尺度检测等策略提高字符检测性能。在自建PCB图像数据集上进行测试,该方法的字符检测精准率为95.6%、召回率为92.4%;特别是综合指标F1为93.6%,优于对比方法,证明了针对PCB图像字符检测问题,所提出的综合检测方法可与当前自然场景图像字符检测的先进方法媲美。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号