期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

王艳莉连晓峰康毛毛《计算机测量与控制》2024,32(12):223-228

针对语义SLAM(simultaneous localization and mapping)中语义分割速度较慢,实时性较低、占用资源过多等问题,提出一种含有自适应通道注意力机制的轻量级Mask R-CNN网络,由于原有的语义分割网络里的残差网络复杂,且应用环境在室内,环境较为简单,故该轻量级网络将原有复杂的主干网络中的ResNet-50利用深度可分离卷积与分组卷积改进为更加轻量的ResNet-DS-tiny(ResNet with depthwise separable convolutions),并加入自适应通道注意力机制。在自适应通道注意力模块中,利用加权方式对输入的RGB-D图像从空间和通道赋予不同的权重,增强了特征的表达能力。此外,为了轻量化特征金字塔,使用使用不同空洞率的空洞卷积来提取不同大小感受野的特征信息,有效地获取了多尺度的特征。相较于传统的特征金字塔,空洞卷积减少了参数量。在更充分获取 RGB 信息特征的同时,提升了语义分割系统的实时性并减少了资源占用。相似文献

2.

结合全局注意力机制的实时语义分割网络

李涛高志刚管晟媛徐久成马媛媛《智能系统学报》2023,18(2):282-292

针对轻量化网络结构从特征图提取有效语义信息不足,以及语义信息与空间细节信息融合模块设计不合理而导致分割精度降低的问题,本文提出一种结合全局注意力机制的实时语义分割网络(global attention mechanism with real time semantic segmentation network ,GaSeNet)。首先在双分支结构的语义分支中引入全局注意力机制,在通道与空间两个维度引导卷积神经网来关注与分割任务相关的语义类别,以提取更多有效语义信息;其次在空间细节分支设计混合空洞卷积块,在卷积核大小不变的情况下扩大感受野,以获取更多全局空间细节信息,弥补关键特征信息损失。然后重新设计特征融合模块,引入深度聚合金塔池化,将不同尺度的特征图深度融合,从而提高网络的语义分割性能。最后将所提出的方法在CamVid数据集和Vaihingen数据集上进行实验,通过与最新的语义分割方法对比分析可知,GaSeNet在分割精度上分别提高了4.29%、16.06%,实验结果验证了本文方法处理实时语义分割问题的有效性。相似文献

3.

基于组注意力卷积和特征重建的轻量分割算法

胡国清谭海亮戈明亮《计算机工程与设计》2022,43(1):120-126

针对卷积神经网络的庞大参数量和计算量难以应用于移动设备或嵌入式设备的问题,提出冗余特征重建模块(redundant feature reconstruction,RFR)和组注意力卷积模块(group attention convolution,GAC),RFR模块使用较少的参数量提取重要的固有特征,通过线性算子重建冗... 相似文献

4.

联合注意力机制和多尺度特征的图像语义分割网络

张蕊刘孟轩孟晓曼武益超《计算机辅助设计与图形学学报》2024,36(10):1528-1537

针对卷积神经网络在图像语义分割时存在部分语义信息丢失、边界定位精度较低等问题,提出联合注意力机制和多尺度特征的卷积神经网络.首先基于注意力机制将网络提取到的多尺度特征进行加权融合,然后采用扩张卷积和全局平均池化聚合多尺度目标信息,最后采用边界精细粒度特征提取模块对分割边界进行优化.在多尺度PASCAL VOC2012和高分辨率Cityscapes数据集上的实验结果表明,所提网络的分割效果显著优于骨干网络ResNet-101,平均交并比分别提高12.2个百分点和9.3个百分点. 相似文献

5.

遥感图像语义分割的多特征注意力融合网络

徐翔徐杨《计算机应用与软件》2023,40(8):187-192+213

针对高分辨率遥感图像中存在背景复杂、目标大小不一、类间具有相似性的问题,提出一种用于遥感图像语义分割的多特征注意力融合网络(Multi-feature Attention Fusion, MAFNet)。MAFNet基于编码和解码结构,在编码阶段,采用空间金字塔池化获取多尺度的上下文信息,同时融合特征通道之间的关联信息,提高特征图的语义表征能力;在解码阶段,基于注意力机制将高层特征与低层特征自适应地融合,逐级恢复目标的细节特征。在公开的数据集Potsdam和Vaihingen上设计了对比实验,PA值分别达到了89.6%和89.1%,验证了该方法的有效性。相似文献

6.

基于增强特征融合解码器的语义分割算法

马震环高洪举雷涛《计算机工程》2020,46(5):254-258,266

针对语义分割中全卷积神经网络解码器部分特征融合低效的问题,设计一种增强特征融合的解码器。级联深层特征与降维后的浅层特征,经过卷积运算后引入自身平方项的注意力机制,通过卷积预测自身项与自身平方项各通道的权重,利用乘法增强后对结果进行作和。基于pascal voc2012数据集的实验结果表明,该解码器相比原网络mIoU指标提升2.14%,结合不同特征融合方式的解码结果也验证了其性能优于同一框架下的其他对比方法。相似文献

7.

空洞可分离卷积和注意力机制的实时语义分割

下载免费PDF全文

王囡侯志强蒲磊马素刚程环环《中国图象图形学报》2022,27(4):1216-1225

目的为满足语义分割算法准确度和实时性的要求,提出了一种基于空洞可分离卷积模块和注意力机制的实时语义分割方法。方法将深度可分离卷积与不同空洞率的空洞卷积相结合,设计了一个空洞可分离卷积模块,在减少模型计算量的同时,能够更高效地提取特征;在网络输出端加入了通道注意力模块和空间注意力模块,增强对特征的通道信息和空间信息的表达并与原始特征融合,以进一步提高特征的表达能力;将融合的特征上采样到原图大小,预测像素类别,实现语义分割。结果在Cityscapes数据集和CamVid数据集上进行了实验验证,分别取得70.4%和67.8%的分割精度,速度达到71帧/s,而模型参数量仅为0.66 M。在不影响速度的情况下,分割精度比原始方法分别提高了1.2%和1.2%,验证了该方法的有效性。同时,与近年来的实时语义分割方法相比也表现出一定优势。结论本文方法采用空洞可分离卷积模块和注意力模块,在减少模型计算量的同时,能够更高效地提取特征,且在保证实时分割的情况下提升分割精度,在准确度和实时性之间达到了有效的平衡。相似文献

8.

基于注意力机制的多尺度融合航拍影像语义分割

郑顾平王敏李刚《图学学报》2018,39(6):1069

航拍影像同一场景不同对象尺度差异较大,采用单一尺度的分割往往无法达到最佳的分类效果。为解决这一问题,提出一种基于注意力机制的多尺度融合模型。首先,利用不同采样率的扩张卷积提取航拍影像的多个尺度特征;然后,在多尺度融合阶段引入注意力机制, 使模型能够自动聚焦于合适的尺度,并为所有尺度及每个位置像素分别赋予权重;最后,将加权融合后的特征图上采样到原图大小,对航拍影像的每个像素进行语义标注。实验结果表明, 与传统的 FCN、DeepLab 语义分割模型及其他航拍影像分割模型相比,基于注意力机制的多尺度融合模型不仅具有更高的分割精度,而且可以通过对各尺度特征对应权重图的可视化,分析不同尺度及位置像素的重要性。相似文献

9.

结合注意力机制的双路径语义分割

下载免费PDF全文

翟鹏博杨浩宋婷婷余亢马龙祥黄向生《中国图象图形学报》2020,25(8):1627-1636

目的针对现有语义分割算法存在的因池化操作造成分辨率降低导致的分割结果变差、忽视特征图不同通道和位置特征的区别以及特征图融合时方法简单,没有考虑到不同感受视野特征区别等问题,设计了一种基于膨胀卷积和注意力机制的语义分割算法。方法主要包括两条路径：空间信息路径使用膨胀卷积,采用较小的下采样倍数以保持图像的分辨率,获得图像的细节信息;语义信息路径使用ResNet（residual network）采集特征以获得较大的感受视野,引入注意力机制模块为特征图的不同部分分配权重,使得精度损失降低。设计特征融合模块为两条路径获得的不同感受视野的特征图分配权重,并将其融合到一起,得到最后的分割结果。结果为证实结果的有效性,在Camvid和Cityscapes数据集上进行验证,使用平均交并比（mean intersection over union,MIoU）和精确度（precision）作为度量标准。结果显示,在Camvid数据集上,MIoU和精确度分别为69.47%和92.32%,比性能第2的模型分别提高了1.3%和3.09%。在Cityscapes数据集上,MIoU和精确度分别为78.48%和93.83%,比性能第2的模型分别提高了1.16%和3.60%。结论本文采用膨胀卷积和注意力机制模块,在保证感受视野并且提高分辨率的同时,弥补了下采样带来的精度损失,能够更好地指导模型学习,且提出的特征融合模块可以更好地融合不同感受视野的特征。相似文献

10.

基于注意力和多标签分类的图像实时语义分割

高翔李春庚安居白《计算机辅助设计与图形学学报》2021,33(1):59-67

针对现阶段很多实时语义分割算法分割精度低,尤其对边界像素分割模糊的问题,提出一种基于跨级注意力机制和多标签分类的高精度实时语义分割算法.首先基于DeepLabv3进行优化,使其达到实时运算速度.然后在此网络基础上增加跨级注意力模块,使深层特征为浅层特征提供像素级注意力,以抑制浅层特征中不准确语义信息的输出;并在训练阶段引入多标签分类损失函数辅助监督训练.在Cityscapes数据集和CamVid数据集上的实验结果表明,该算法的分割精度分别为68.1%和74.1%,分割速度分别为42帧/s和89帧/s,在实时性与准确性之间达到较好的平衡,能够优化边缘分割,在复杂场景分割中具有较好的鲁棒性. 相似文献

11.

融合空间十字注意力与通道注意力的语义分割网络

吴文欢张淏坤《图学学报》2023,44(3):531-539

针对现有语义分割方法无法有效构建上下文语义关联关系以及所提取的语义特征表征能力不足的问题,提出了一种新的空间十字注意力与通道注意力相融合的语义分割网络。首先,采用空间十字注意力模块(SCCAM)聚合目标像素在水平和垂直方向上的上下文信息,进而高效地建立像素之间的非局部语义依赖关系。其次,在通道注意力模块(CAM)中引入多头注意力机制,在多个通道子空间上挖掘语义更显著的通道特征。在此基础上,通过融合空间与通道两个维度上的注意力特征,进一步增强特征的语义表征能力,提升语义分割精度。在Cityscapes数据集、PASCAL VOC2012数据集以及CamVid数据集上的实验结果表明,与其他先进语义分割方法相比,该网络模型具有更高的分割精度。相似文献

12.

融合空洞卷积与注意力的胃癌组织切片分割

下载免费PDF全文

陈颍锶李晗周雪婷万程《中国图象图形学报》2021,26(9):2281-2292

目的病理组织切片检查是诊断胃癌的金标准,准确发现切片中的病变区域有助于及时确诊并开展后续治疗。然而,由于病理切片图像的复杂性、病变细胞与正常细胞形态差异过小等问题,传统的语义分割模型并不能达到理想的分割效果。基于此,本文提出了一种针对病理切片的语义分割方法ADEU-Net （attention-dilated-efficient U-Net++）,提高胃癌区域分割的精度,实现端到端分割。方法 ADEU-Net使用经过迁移学习的EfficientNet作为编码器部分,增强图像特征提取能力。解码器采用了简化的U-Net++短连接方式,促进深浅层特征融合的同时减少网络参数量,并重新设计了其中的卷积模块提高梯度传递能力。中心模块使用空洞卷积对编码器输出结果进行多尺度的特征提取,增强模型对不同尺寸切片的鲁棒性。编码器与解码器的跳跃连接使用了注意力模块,以抑制背景信息的特征响应。结果在2020年“华录杯”江苏大数据开发与应用大赛（简称“SEED”大赛）数据集中与其他经典方法比较,验证了一些经典模型在该分割任务中难以拟合的问题,同时实验得出修改特征提取方式对结果有较大提升,本文方法在分割准确度上比原始U-Net提高了18.96%。在SEED数据集与2017年中国大数据人工智能创新创业大赛（brain of things,BOT）数据集中进行了消融实验,验证了本文方法中各个模块均有助于提高病理切片的分割效果。在SEED数据集中,本文方法ADEU-Net比基准模型在Dice系数、准确度、敏感度和精确度上分别提升了5.17%、2.7%、3.69%、4.08%;在BOT数据集中,本文方法的4项指标分别提升了0.47%、0.06%、4.30%、6.08%。结论提出的ADEU-Net提升了胃癌病理切片病灶点分割的精度,同时具有良好的泛化性能。相似文献

13.

轻量化卷积神经网络在SAR图像语义分割中的应用

水文泽孙盛余旭邓少平《计算机应用研究》2021,38(5):1572-1575,1580

针对合成孔径雷达图像的语义分割问题,构建了一个全新的TerraSAR-X语义分割数据集GDUT-Nansha。然后,为解决传统深度学习方法模型体积大,难以在样本数量偏少的合成孔径雷达图像数据集上应用的问题,对轻量化卷积神经网络ENet模型进行了分析和改造。提出了一种改进的轻量化卷积神经网络模型(revised weighted loss eNet,RWL-ENet);针对合成孔径雷达图像数据集样本不平衡问题,使用了带有权重的损失函数。通过和其他经典卷积神经网络语义分割模型的对比实验,验证了新数据集的可靠性;同时,在参数量和模型体积远远小于其他网络模型的前提下,RWL-ENet模型在像素精度、平均像素精度、平均交并比三个定量指标上分别达到了0.884、0.804和0.645。相似文献

14.

融合注意力机制和多层次特征的语义分割方法

王威威;罗杨;李熹《工业控制计算机》2025,(4):93-95

当前存在的图像语义分割方法普遍存在无法充分利用全局信息和有效提取利用边缘信息的问题。针对以上问题,提出一种基于deeplabv3+的改进算法。该算法在编码端,加入一个non-local模块,以充分利用全局特征信息。在解码端加入CA(Coordinate Attention)模块提升目标边缘信息利用率。该方法在PASCAL VOC 2012数据集上进行实验,取得了77.4%的平均交并比结果。相似文献

15.

条带池化注意力的实时语义分割算法

吕佳孙亚南许鹏程《计算机辅助设计与图形学学报》2023,35(9):1395-1404

针对目前面向注意力机制语义分割算法不能兼顾分割精度与实时性,以及难以满足在现实场景中应用的问题,提出一种基于条带池化注意力的实时语义分割算法.首先采用轻量级骨干网络提取特征信息,结合不同网络层语义差异构建特征融合模块获得不同尺度的上下文信息以提升分割精度;然后利用基于注意力的条带注意力模块(SAM)提高远距离信息被弱化的注意力,并在SAM中加入水平方向的条带池化以降低编码全局上下文的运算量.实验结果表明,所提算法能够得到较高分割精度且满足实时性要求;在Cityscapes测试集上平均交并比为70.6%,分割速度达到了92帧/s;在CamVid测试集上平均交并比为66.4%,分割速度达到了196帧/s. 相似文献

16.

融合低阶特征与全局特征的图像语义分割方法

董立红李宇星符立梅《计算机工程与应用》2021,57(17):210-216

目前,深度全卷积网络在图像语义分割领域已经取得了瞩目的成就,但特征图的细节信息在多次下采样过程中会大量损失,对分割精度造成影响.针对该问题设计了一个用于图像语义分割的深度全卷积网络.该网络采用\"编码器—解码器\"结构,在编码器后端引入空洞卷积以降低细节信息的损失,在解码过程中融合对应尺寸的低阶语义特征,并在解码器末端融入... 相似文献

17.

全卷积注意力机制神经网络的图像语义分割

欧阳柳贺禧瞿绍军《计算机科学与探索》2022,16(5):1136-1145

全卷积神经网络是一种强大的端到端的模型,在语义分割领域应用广泛,获得了巨大的成功.研究人员提出了一系列基于完全卷积神经网络的方法,但是随着卷积和池化的持续性下采样,图像的上下文信息将会丢失,影响了像素级分类.针对完全卷积网络上下文信息丢失问题,提出基于像素的注意力方法.该方法利用计算高级特征图像素之间的联系来获取全局信... 相似文献

18.

分级特征融合的图像语义分割

赵小强徐慧萍《计算机科学与探索》2021,15(5):949-957

在图像语义分割中,利用卷积神经网络对图像信息进行特征提取时,针对卷积神经网络没有有效利用各层级间的特征信息而导致图像语义分割精度受损的问题,提出分级特征融合的图像语义分割方法.该方法利用卷积结构分级提取含有像素级的浅层低级特征和含有图像级的深层语义特征,进一步挖掘不同层级间的特征信息,充分获取浅层低级特征和深层语义特征... 相似文献

19.

基于可变形卷积和语义嵌入式注意力机制的眼球超声图像分割方法

下载免费PDF全文

盛克峰李文星《计算机系统应用》2022,31(2):342-349

眼球区域分割是医学超声图像处理和分析的关键步骤,由于临床设备采集的眼球超声图像具有噪声干扰、区域模糊、边缘灰度相似等缺点,从而导致现有的方法不能准确地分割出眼球区域,因此本文基于可变形卷积提出了一种语义嵌入的注意力机制的分割方法.首先使用可变形卷积替代传统的卷积,提高本文网络对眼球区域的表征能力;其次构建语义嵌入的注意... 相似文献

20.

融合注意力和多尺度特征的街景图像语义分割

下载免费PDF全文

洪军刘笑楠刘振宇《计算机系统应用》2024,33(5):94-102

为了解决在街道场景图像语义分割任务中传统U-Net网络在多尺度类别下目标分割的准确率较低和图像上下文特征的关联性较差等问题,提出一种改进U-Net的语义分割网络AS-UNet,实现对街道场景图像的精确分割.首先,在U-Net网络中融入空间通道挤压激励(spatial and channel squeeze&excitation block, scSE)注意力机制模块,在通道和空间两个维度来引导卷积神经网络关注与分割任务相关的语义类别,以提取更多有效的语义信息;其次,为了获取图像的全局上下文信息,聚合多尺度特征图来进行特征增强,将空洞空间金字塔池化(atrous spatial pyramid pooling, ASPP)多尺度特征融合模块嵌入到U-Net网络中;最后,通过组合使用交叉熵损失函数和Dice损失函数来解决街道场景目标类别不平衡的问题,进一步提升分割的准确性.实验结果表明,在街道场景Cityscapes数据集和Cam Vid数据集上AS-UNet网络模型的平均交并比(mean intersection over union, MIo U)相较于传统U-Net网络分别提... 相似文献