首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 140 毫秒
1.
刘杰  朱旋  宋密密 《控制与决策》2021,36(10):2483-2489
针对自然场景中文字符检测率低、小字符检测困难以及字符检测类别多样等问题,提出一种基于YOLOv2的改进方法,并将其应用于自然场景中文字符检测中.首先利用k-means++聚类算法对字符目标候选框(anchor)的数量和宽高比维度进行聚类分析,提出多层特征融合策略,对原网络中第4个最大池化层前所输出的特征图经过3times3和1times1大小的卷积核进行卷积操作,并执行4倍的下采样得到局部特征;然后对第5个最大池化层前所输出的特征图经过3times3和1times1大小的卷积核进行卷积操作,并执行2倍的下采样得到局部特征,将局部特征与全局特征融合,同时增加高层卷积中的重复卷积层,将高层卷积中连续且重复的3times3times1024大小的卷积层数由3增加为5;最后使用Chinese text in the wild(CTW)数据集对YOLOv2和改进的YOLOv2算法进行对比实验,结果表明,改进后的YOLOv2算法在中文字符检测中平均准确率均值为78.3%,较原YOLOv2算法提升了7.3%,且明显高于其他自然场景中的文字符检测方法.  相似文献   

2.
为解决遥感飞机检测算法网络计算复杂、检测精度低的问题,以主流网络YOLOv4为基础,从提高精度和简化模型两个方面进行改进研究,提出一种轻量级多尺度监督网络LDS_YOLO(light dense supervision YOLO)。针对遥感飞机目标细节信息提取不足的问题,改进三组多尺度融合预测层结构,在每一个支路第一次上采样前的四个卷积块之间设计密集连接方式,可以增强融合不同尺度飞机,丰富特征细节信息,提高预测准确率;针对目标特征关联度低的问题,引入一致性监督损失函数,通过监督分类网络辅助预测的同时提高检测精度;通过增加包含全局平均池化层、全连接层和特征映射层的轻量化模块,调整通道结构减少权重模型的特征冗余,降低网络参数量。在保证检测率的基础上将模型参数量降低为3.6×106,计算量为77?MFLOPs,测试检测率比原始模型损失不到2.3%,速度达到17?frame/s;通过与主流检测算法进行对比,分析轻量化后算法模型的抗过拟合能力和鲁棒性,证明轻量化遥感飞机目标检测算法的有效性和可行性。  相似文献   

3.
特征融合是文本检测算法的重要步骤。为提升文本检测的召回率和准确率,提出一种利用RefineNet(Refinement Network)网络进行特征融合的改进EAST(Efficient and Accurate Scene Text Detector)算法。以ResNet(Residual Network)残差网络作为特征提取层的骨干网络,提取出2-5层的特征图;用RefineNet取代East模型中的维度拼接算法,融合多分辨率特征,将4路特征图合并成1路RCU(Residual Conv Unit)输出;经过卷积、池化和上采样等操作在输出层得到文本框的置信度、文本框的位置信息以及文本框旋转角度,通过非最大值抑制输出检测结果。实验结果表明,在相同实验环境条件下,采用该方法比原EAST方法准确率提高约2百分点,召回率提高约8百分点。  相似文献   

4.
针对电连接器缺陷检测目前存在自动化程度低、检测精度低、检测速度慢以及鲁棒性较差等问题,提出了一种改进的Yolo v3算法来检测电连接器的缺陷。首先采用K-means聚类算法对本文数据集进行聚类分析得到3种宽高比的候选框,针对本文缺陷对象提高检测精度;对主干网络第三个残差块输出的8倍降采样特征图进行4倍上采样,将得到的特征图与第二个残差块输出的2倍降采样特征图进行拼接得到融合特征检测层;将目标检测层之前经过的6个DBL单元改为2个DBL单元加上2个残差单元,以提高特征的复用与获取;另外本文选择单尺度特征图进行目标检测,而不是原网络的多尺度预测,既节省了计算量,又一定程度上避免误检。通过定性与定量的实验结果表明,本文改进后的Yolo v3算法对电连接器缺陷检测有着更好的性能以及速度,准确率为93.5%,相较于Faster R-CNN更加准确,原Yolo v3更加快速,基本上满足了工业现场对电连接器检测的要求。  相似文献   

5.
邹聪  梁永全 《计算机应用与软件》2021,38(10):164-167,241
为了精准检测输电线路周围的鸟类数目,及时驱鸟以确保线路的正常运行,对YOLO V3算法提出两点改进:将原网络中52×52尺度的特征图进行2倍上采样后与第二个残差块拼接,建立特征融合的检测层,提高算法对小目标的检测精确率;通过计算检测框对应的比例因子更新检测框的置信分数,对非极大值抑制算法NMS进行优化,提升模型对遮挡鸟类的检测能力.实验结果表明该模型精确率可达88.36%,可以有效地检测输电线路周围的鸟类数目.  相似文献   

6.
瞿中  陈雯 《计算机科学》2022,49(3):192-196
混凝土路面的裂缝检测是确保道路安全的重要基础任务。针对混凝土路面的复杂背景和裂缝本身复杂的拓扑结构,提出了一种基于空洞卷积和多特征融合的混凝土路面裂缝检测网络,该网络采用基于U-Net的编码-解码结构。在编码阶段,使用改进的残差网络Res2Net提高特征提取能力;在网络的中间部分,使用串联和并联相结合的不同空洞率的空洞卷积,从而在增加特征点的感受野的同时不会降低特征图的分辨率;在解码阶段,融合了从低层卷积到高层卷积的多尺度和多级特征,提高了裂缝检测的准确性。为证明所提算法的有效性和准确性,将其与现有的部分检测方法进行了比较并使用F-score来评估检测性能。在多个混凝土路面数据集上的实验结果表明,该算法提高了裂缝检测的准确性,具有较好的鲁棒性。  相似文献   

7.
SSD (Single Shot multi-box Detector)算法是在不同层的特征图上,进行多尺度对象的检测,具有速度快和精度高的特点.但是,传统SSD算法的特征金字塔检测方法很难融合不同尺度的特征,并且由于底层的卷积神经网络层具有较弱的语义信息,也不利于小物体的识别,因此本论文提出了以SSD算法的网络结构为基础的一种新颖的目标检测算法RF_SSD,该算法将不同层及不同尺度的特征图以轻量级的方式相融合,下采样层生成新的特征图,通过引入感受野模块,提高网络的特征提取能力,增强特征的表征能力和鲁棒性.和传统SSD算法相比,本文算法在精度上有明显提升,同时充分保证了目标检测的实时性.实验结果表明,在PASCAL VOC测试集上测试,准确率为80.2%,检测速度为44.5 FPS.  相似文献   

8.
电力系统的安全对于整个能源传输过程至关重要。针对输电线路下超大工程车辆和烟火为主要的外力破坏行为,对单阶段目标检测算法YOLOv5s进行改进,首先针对输电线路多雨雾烟尘等工作环境,引入限制对比度自适应直方图均衡算法CLAHE对图片进行去雾处理,提升图片对比度;针对检测目标距离较远的问题,在YOLOv5s网络的基础上添加CA注意力机制,提升了模型对目标的定位能力;将原网络中的最邻近差值采样方式替换为轻量级通用上采样算子CARAFE,更好地捕捉特征图的同时引入较小的参数量;最后在网络的特征融合层,使用具有通道混洗思想的GSConv卷积模块代替标准卷积模块,减小模型参数量,再利用slim_neck特征融合结构,强化目标关注度,达到减小模型参数量同时提升检测精度的效果。实验结果表明:改进后的YOLOv5s网络,mAP提升了4.4%,参数量减小了3.4%,权重模型内存减小了2.7%,证明了算法的有效性。  相似文献   

9.
为了轻量化模型,便于移动端设备的嵌入,对YOLOv4网络进行了改进.首先,用MobileNetV3作为主干网络,并使用深度可分离卷积替换加强特征提取网络的普通卷积,降低模型参数量;其次,在104×104特征图输出时融合空洞率为2的空洞卷积,与52×52的特征层进行特征融合,获取更多的语义信息和位置信息,细化特征提取能力,提升模型对极小目标的检测性能;最后,将原来的池化层使用3个5×5的Maxpool进行串联,减少计算量,提升检测速度.实验结果表明,在华为云2020数据集上,改进算法的mAP比YM算法提高了2.33%,在公共数据集VOC07+12上, mAP提高了3.12%, FPS比原来的YOLOv4算法提高了一倍多,参数量降低至原来的18%,证明了改进算法的有效性.  相似文献   

10.
研究了基于深度学习的遥感图像语义分割问题,将建筑物作为遥感图像中的待分割目标,采用语义分割算法将建筑物提取出来.提出了一种改进的U-net网络,根据分割实际需求,保持网络对目标提取特征能力的前提下,将原U-net网络的卷积核数量适当减少,降低了网络参数数量和计算复杂度;增加了Batch Normalization层抑制过拟合问题;在上采样部分增加特征图的局部信息以优化网络对于细节的分割效果.使用公开的数据集INRIA Aerial Image Dataset来评估改进的U-net网络的实际效果,和原U-net相比,单张图片训练速度提升了8%,分割精度也明显提升,训练中的过拟合情况得到改善.证明了本文改进的U-net网络具有对遥感图像的语义分割任务的有效性和可行性.  相似文献   

11.
传统的全卷积神经网络由于不断的池化和下采样操作使得最后的特征热点图分辨率损失严重,导致了分割结果的细节刻画能力的缺失,为了弥补这一缺陷,往往通过跳跃连接融合中层的特征图以恢复空间信息.由于无法充分利用网络的低层特征信息,传统全卷积网络的特征融合阶段存在相当的缺陷,本文对这一现象进行了深入的分析.本文在上采样路径之前采用基于特征金字塔的特征信息增强方法,克服了浅层特征图语义信息匮乏这一缺点,使得整个网络能更充分的利用前向计算产生的特征图,输出的分割结果也更为精确.本文提出的算法在Pascal VOC数据集上取得了75.8%的均像素精度和83.9%的权频交并比,有效的提高了分类精度.  相似文献   

12.
针对雾霾环境下车辆检测准确率低、漏检严重的问题, 提出一种多尺度特征融合的雾霾环境下车辆检测算法. 首先利用条件生成对抗网络对雾霾图像进行去雾预处理, 然后针对雾霾环境下目标特征不明显的特点, 提出多尺度特征融合模块, 在YOLOv3的基础上, 从主干网络提取特征时增加一条浅层分支和深层特征进行上采样拼接融合, 得到尺度为104×104的特征图, 用于增强浅层的语义信息. 并采用CBAM注意力机制引导下的特征增强策略, 保证上下文信息的完整性, 以提高检测的精度, 最后将去雾后图片送入改进后的YOLOv3网络进行检测. 实验结果表明, 相较于原始网络, 该算法在RTTS数据集上的检测结果更加优秀, 模型可以达到81%的平均精度和67.52%的召回率, 能够更加精确的定位到车辆.  相似文献   

13.
针对于遥感图像中背景复杂噪声多、小目标多且排布密集、目标尺度差异大等问题,提出了一种改进通道注意力与残差收缩网络的遥感图像目标检测算法。该算法借助卷积神经网络,以YOLOV3模型作为基础网络,选择Mosaic图像增强的方式进行数据预处理,采用深度残差收缩模块重构了特征提取网络,并结合通道注意力机制与组合池化构建空间金字塔池化融合层,采用CIOU进行定位损失计算,最终实现遥感图像目标检测。实验结果表明:改进算法相比于原算法的总体mAP由89.2%提升至92.2%,获得了更好的性能表现。  相似文献   

14.
针对交通标志目标检测尺寸较小、分辨率低、特征不明显问题,提出一种改进的YOLOv3网络模型。在利用颜色增强方法对交通标志进行数据增强后,改进原网络中的FPN结构,保留原网络中52×52的大尺度预测,然后利用YOLOv3网络中第二次下采样输出的特征图建立108×108的更大尺度预测。为了解决图像尺寸和失真的问题,在检测层前使用固定分块大小为5、9、13的池化操作,再将输出的特征与原来的特征图进行融合,从而实现对不同尺寸的输入得到相同大小的输出。最后,利用K-means聚类算法对TT100K交通标志数据集进行聚类分析,重新定义网络的初始候选框,使用YOLOv3网络模型和改进的YOLOv3网络模型以及其他小目标检测算法在TT100K数据集上进行对比实验。实验结果表明,改进后的YOLOv3网络模型能更有效的检测交通标志,其检测的平均精确度在三个尺度下相对原YOLOv3网络模型分别提升8.3%、6.1%、4.3%,在FPS变化不大的情况下,召回率和准确率都有明显提升,同时,改进后的YOLOv3算法相对其他小目标检测算法具有更好的检测精度和实时性。  相似文献   

15.
针对当前目标检测任务中对小目标检测识别率低,漏检率高的问题,提出一种基于门控通道注意力机制(EGCA)和自适应上采样模块的改进YOLOv3算法。该算法采用DarkNet-53作为主干网络进行图片基础特征提取;引入自适应上采样模块对低分辨率卷积特征图进行扩张,有效增强了不同尺度卷积特征图的融合效果;在三个尺度通道输出预测结果之前分别加入EGCA注意力机制以提高网络对小目标的特征表达和检测能力。将改进的算法在公开数据集RSOD(remote sensing object detection)上进行实验,小目标检测精度提升了8.2个百分点,最为显著,平均精度AP值达到56.3%,较原算法提升了7.9个百分点。实验结果表明,改进的算法相比于传统YOLOv3算法和其他算法拥有更好的小目标检测能力。  相似文献   

16.
为解决有纹理模型在遮挡条件下6D位姿估计精确度不高的问题,提出了一种局部特征表征的端到端6D位姿估计算法。首先为了得到准确的定位信息,提出了一个空间—坐标注意力机制(spatial and coordinate attention),通过在YOLOv5网络中加入空间—坐标注意力机制和加权双向特征金字塔网络(bidirectional feature pyramid network),YOLOv5-CBE算法的精确度(precision)、召回率(recall)、平均精度均值(mAP@0.5)分别提升了3.6%、2.8%、2.5%,局部特征中心点坐标误差最高提升了25%;然后用 YOLOv5-CBE算法检测局部特征关键点,结合3D Harris关键点通过奇异值分解法(singular value decomposition)计算模型的6D位姿,最高遮挡70%的情况下仍然可以保证二维重投影精度(2D reprojection accuracy)和ADD度量精度(ADD accuracy)在95%以上,具有较强的鲁棒性。  相似文献   

17.
针对复杂背景下细小裂纹图像检测难、噪声干扰多和裂纹宽度信息易丢失的问题,提出一种基于U-Net改进的方法。利用残差块解决网络退化,加入BN层改善梯度弥散,融入深度可分离卷积以及高尺度的转置卷积,实现特征信息由浅入深的传递;改进注意力机制,实现细节特征的优化;延伸U-Net特征向量长度,在底部加入由最大池化层、小尺度深度可分离卷积与上采样层构建的层融合模块,实现分辨率和感受野之间的平衡。实验结果表明,在客观标准下,改进的方法比U-Net的IoU的值提高0.1873,Recall的值提高了0.1127,Precision提高了0.1359,F1-score提高了0.0687,并且实验结果皆优于其他方法对于U-Net的改进,减少了伪分割现象,完成对细小裂纹分割,获得更加精细的裂纹宽度信息。  相似文献   

18.
从遥感影像中提取道路目标对智慧城市建设具有重要意义。由于遥感数据中道路及背景特征复杂多样,使用深度学习方法对道路进行提取的准确性仍然受到限制。基于U-Net网络架构设计实现了用于遥感影像道路提取的深度语义分割模型AS-Unet,该模型分为编码器和解码器两部分。在编码器部分加入通道注意力机制,对提取的丰富低层特征进行筛选,突出目标特征,抑制背景噪声干扰,从而提高深浅层信息融合准确率;为解决网络对道路目标单一尺寸的敏感问题,在编码器最后一层卷积层后面加入空间金字塔池化模块来捕获不同尺度道路特征;在解码器部分加入空间注意力机制,进行位置关系信息学习和深层次语义特征筛选,提高特征图还原能力。在Massachusetts和DeepGlobe道路数据集上进行实验,结果证明,在召回率、精度、[F1]值等评估指标上,明显优于SegNet、FCN等语义分割网络。所设计的AS-Unet网络性能优良,具有更高的分割准确率,具备一定理论和实际应用价值。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号