期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

欧阳柳贺禧瞿绍军《计算机科学与探索》2022,16(5):1136-1145

全卷积神经网络是一种强大的端到端的模型,在语义分割领域应用广泛,获得了巨大的成功.研究人员提出了一系列基于完全卷积神经网络的方法,但是随着卷积和池化的持续性下采样,图像的上下文信息将会丢失,影响了像素级分类.针对完全卷积网络上下文信息丢失问题,提出基于像素的注意力方法.该方法利用计算高级特征图像素之间的联系来获取全局信... 相似文献

2.

多尺度注意力引导的全景分割网络

付都瞿绍军付亚《计算机工程与应用》2023,(22):223-232

全景分割是近年来新提出的图像分割任务。现有全景分割模型大都对前景实例对象和背景未定形区采用不同的方式进行特征表示,因此需要额外的后处理和融合操作来处理各种实例重叠和语义冲突问题。全卷积全景分割网络实现了统一的特征表示,省去了这些复杂操作,但其对于前景实例对象的分割准确率不高,对图像中远距离小目标的分割效果不是很理想。针对这些问题,基于全卷积全景分割网络进行改进优化,提出一种多尺度注意力引导的全景分割网络。首先改进特征提取网络,通过在主干网中添加一条自底向上的辅助路径来增强模型的多尺度特征获取能力。其次提出一种注意力模块,通过将空洞空间金字塔池化与通道注意力融合,来引导卷积核更新,生成更匹配的权重。在Cityscapes数据集上与全卷积全景分割网络进行对比实验,图像实例级全景分割质量提高了2.74个百分点,背景未定形区全景分割质量和综合全景分割质量分别提高了1.36个百分点和1.94个百分点,对于交通灯和摩托车等小物体的类别检测准确率分别提高了4.4个百分点和8.3个百分点。提出的全景分割网络综合了全卷积全景分割网络、多尺度特征及注意力机制的优点,使得图像实例级全景分割准确率更高。相似文献

3.

改进ASPP及多层次特征语义融合分割方法

王银宇孟凡云王金鹤刘志浩《计算机工程与应用》2023,(13):220-228

为解决图像语义分割中多尺度目标分割困难、类别边界预测不准确等问题,提出一种基于改进空洞空间金字塔池化的多层次特征语义融合分割方法。将深层次网络特征按通道分组,利用分组空洞空间金字塔池化模块捕获每个分组多尺度特征上下文信息;引入条状池化模块对上下文信息补充和完善,增强全局语义信息表达;根据语义引导融合模块建立不同层次特征像素间对应关系,将深层次语义信息以自底向上方式逐步融入到低层次高分辨率图像中。实验结果表明,该方法在PASCAL VOC 2012和Cityscapes公开数据集上分别获得73.1%、71.8%的平均交并比,且在相同精度下,该方法减少了39%的参数量。相似文献

4.

基于注意力机制和深度卷积神经网络的材质识别方法

许华杰杨洋李桂兰《计算机科学》2021,48(10):220-225

材质识别旨在识别自然材质图像中的主要对象及其所属材料类别.针对材质图像数据集通常数据量少、人工标注局部纹理区域困难所导致的材质识别准确率低的问题,提出了一种基于注意力机制和深度卷积神经网络的材质识别方法,该方法的核心是材质识别深度卷积神经网络(MaterialNet).MaterialNet利用深度残差网络对图像进行特... 相似文献

5.

基于FCN-LSTM的工业烟尘图像分割

张俊鹏刘辉李清荣《计算机工程与科学》2021,43(5):906-916

工业生产中常根据林格曼烟气黑度判断工业烟尘的污染等级,一种有效的方式是应用计算机视觉系统对工业烟尘进行监测, 其中对烟尘目标进行准确分割是该系统的关键技术。因为工业烟尘具有形状不固定、和云相似度高等特点,现有算法在复杂场景下对烟尘进行分割时容易受到干扰,分割准确度有待提高。针对这一问题,提出一种基于FCN-LSTM的工业烟尘图像分割方法,在全卷积网络对图像空间特征提取的基础上,使用长短时记忆网络提取图像序列的时间信息,通过烟尘的动态特征对运动的烟尘和背景进行区分,增强复杂场景下的抗干扰能力。实验表明,本文模型相比于全卷积网络,在复杂场景下的抗干扰能力有显著提升,能够有效克服来自云的干扰,对全卷积网络分割结果中易出现干扰点的问题也有改善,IoU指标最高有8.04%的提升。相似文献

6.

融合多维注意力机制CNN皮肤肿瘤图像分割提取

下载免费PDF全文

高正君张佩炯司小强《计算机测量与控制》2022,30(8):161-168

针对卷积神经网络(CNN)在医学图像分割时,受皮肤病损图像多样性、分割目标位置、形状及尺度变化等因素影响,提出了一种基于传统卷积神经网络综合注意力模块图像分割算法。首先利用U-Net主干网络的优势,其目的让图像特征提取更完善；其次,由空间、通道、尺度构成的综合注意力机制对目标病灶区域进行检测识别,利用通道级联把来自编码器中低级图像特征和解码器中高级图像特征注意力结合起来进行权值自适应融合,提升了网络对样本病灶区的关注度和辨识力,突出强调最相关的特征通道和多尺度间最显著的特征图。通过对ISIC2018数据集及医院整形外科提供患者不同类型的皮肤肿瘤图像进行分割测试,并将注意力模块随机组合形成的不同算法进行指标评价比对,所提出算法的平均分割精度可达92.89%。实验结果表明,所提出算法是有效可行的,在多维度下分割处理带复杂背景的皮肤病灶图像时有更高的鲁棒性。相似文献

7.

融合注意力机制的多模态脑肿瘤MR图像分割

毋小省杨奇鸿唐朝生孙君顶《计算机辅助设计与图形学学报》2023,(9):1429-1438

针对在多模态MR图像分割中对不同模态特征间的关联性及全局和局部特征提取考虑不充分,导致分割精度降低的问题,基于注意力机制,提出多模态脑肿瘤MR图像分割方法.首先提出三重注意力模块,用于增强各模态特征间的关联性以及对感兴趣区域的位置和边界信息精确判断;然后设计空间和通道注意力模块,用于双重捕获空间和通道上的全局及局部特征,增强对肿瘤组织结构信息的学习能力.在公开数据集BraTs18和BraTs19上的实验结果表明,分割全肿瘤时,所提方法的Dice系数、精确率、灵敏度和Hausdorff距离分别达到了90.62%, 87.89%, 90.08%和2.258 3,均优于对比的同类方法. 相似文献

8.

FSNet: 基于频率特性的烟雾图像分割网络

吴健辉何灿何俊康谢永芳赵林张国云《控制理论与应用》2023,40(4):702-712

烟雾图像分割是对烟雾进行识别与精准定位的基础, 是火灾预警的重要手段. 针对烟雾分割时存在过分割、欠分割以及边界拟合粗糙的问题, 本文提出一种基于频率分离特性的烟雾图像分割网络. 所提出的频率分离模块将特征图中的烟雾区域分离为低频主体部分和高频边界部分, 同时基于多任务学习设计多模块权重自适应损失函数对烟雾整体、主体、边界分别监督学习, 起到细化烟雾边界和改善烟雾整体分割结果的作用; 此外, 结合可变形卷积提出改进的空洞空间金字塔池化模块以解决其信息利用率低和特征关联性差的问题. 在对比实验中, FSNet的烟雾交并比为76.55%, 比基线网络提高了4.25%. 可视化分割结果可以看出, FSNet能有效缓解过分割、欠分割, 所得烟雾边界更平滑, 烟雾图像分割的整体性能获得较大提升. 相似文献

9.

基于多尺度注意力机制的道路场景语义分割模型

范润泽刘宇红张荣芬李景玉《计算机工程》2023,49(2):288-295

通过对道路场景进行语义分割可以辅助车辆感知周边环境,达到避让行人、车辆以及各类小目标物体障碍的目的,提高行驶的安全性。针对道路场景语义分割中小目标物体识别精度不高、网络参数量过大等问题,提出一种基于多尺度注意力机制的语义分割模型。利用小波变换的多尺度多频率信息分析特性,设计一种多尺度小波注意力模块,并将其嵌入到编码器结构中,通过融合不同尺度及频率的特征信息,保留更多的边缘轮廓细节。使用编码器与解码器之间的层级连接,以及改进的金字塔池化模块进行多方面特征提取,在保留上下文特征信息的同时获得更多的图像细节。通过设计多级损失函数训练网络模型,从而加快网络收敛。在剑桥驾驶标注视频数据集上的实验结果表明,该模型的平均交并比为60.21%,与DeepLabV3+和DenseASPP模型相比参数量减少近30%,在不额外增加参数量的前提下提升了模型的分割精度,且在不同场景下均具有较好的鲁棒性。相似文献

10.

基于注意力与金字塔融合的医学图像分割仿真

赵广文王阳杨晨《计算机仿真》2022,39(2):184-190

针对现有的U-Net编解码结构网络的边缘模糊以及上下文信息提取能力弱等问题,提出了在编解码结构网络基础上融合反向注意力和金字塔模块的图像分割网络。网络以Res2Net50作为特征编码器提取特征,在编码器与解码器中引入尺度感知金字塔融合模块,加强网络对上下文信息的提取能力,然后在跳跃连接处加入反向注意力模块,用以提取边缘结构信息,最后使用特征拼接融合特征信息,提升网络模型分割性能。实验结果证明,改进的网络在Liver CT、Finding lungs in CT以及CHAOS数据集上的分割精度均有一定的提升,可以有效改善分割图像边缘模糊等问题。相似文献

11.

多尺度条形池化与通道注意力的图像语义分割

下载免费PDF全文

马吉权赵淑敏孔凡辉《中国图象图形学报》2022,27(12):3530-3541

目的针对自然场景下图像语义分割易受物体自身形状多样性、距离和光照等因素影响的问题,本文提出一种新的基于条形池化与通道注意力机制的双分支语义分割网络(strip pooling and channel attention net, SPCANet)。方法 SPCANet从空间与内容两方面对图像特征进行抽取。首先,空间感知子网引入1维膨胀卷积与多尺度思想对条形池化技术进行优化改进,进一步在编码阶段增大水平与竖直方向上的感受野;其次,为了提升模型的内容感知能力,将在ImageNet数据集上预训练好的VGG16(Visual Geometry Group 16-layer network)作为内容感知子网,以辅助空间感知子网优化语义分割的嵌入特征,改善空间感知子网造成的图像细节信息缺失问题。此外,使用二阶通道注意力进一步优化网络中间层与高层的特征选择,并在一定程度上缓解光照产生的色差对分割结果的影响。结果使用Cityscapes作为实验数据,将本文方法与其他基于深度神经网络的分割方法进行对比,并从可视化效果和评测指标两方面进行分析。SPCANet在目标分割指标mIoU(mean inter... 相似文献

12.

基于卷积神经网络的语义分割算法研究

熊炜童磊金靖熠王传胜王娟曾春燕《计算机应用研究》2021,38(4):1261-1264

针对语义分割中残差网络并不能完好地提取图像信息和分割效果差的问题,提出一种联合特征金字塔模型(JFP)用来融合残差网络的输出特征,并结合暗黑空间金字塔池化模型(ASPP)进一步提取特征。在解码部分应用简单的解码结构,恢复图像尺寸完成语义分割;同时引入注意力模型作为辅助语义分割网络,辅助神经网络进行训练。该方法分别在Pascal VOC 2012数据集和增强的Pascal VOC 2012数据集上对网络进行训练,并在Pascal VOC 2012的验证集上进行测试,其平均交并集之比(mIoU)分别达到了78.55%和80.14%,表明该方法具有良好的语义分割性能。相似文献

13.

基于分组卷积进行特征融合的全景分割算法

冯兴杰张天泽《计算机应用》2021,41(7):2054-2061

针对图像全景分割任务对于实践应用中现有网络结构运算不够快速的问题,提出一种基于分组卷积进行特征融合的全景分割算法.首先,通过自底向上的方式选择经典残差网络结构(ResNet)进行特征提取,并采用不同扩张率的空洞卷积空间金字塔池化操作(ASPP)对提取到的特征进行语义分割与实例分割的多尺度特征融合;然后,通过提出一种单路... 相似文献

14.

基于空间分频的超声图像分割注意力网络

沈雪雯王晓东姚宇《计算机应用》2021,41(6):1828-1835

针对医学超声影像噪点多、边界模糊,器官轮廓很难界定的问题,提出了一种基于空间分频的超声图像分割注意力网络（SFDA-Net）。首先,借助Octave卷积在整个网络中对图像实现了高、低频并行处理,从而获得更加多元的信息。然后,加入卷积块注意模块（CBAM）,使图像特征恢复时更加关注有效信息,以减小分割目标整体区域的缺失。最后,使用Focal Tversky Loss作为目标函数,从而降低简单样本的权重并加强对困难样本的关注,以及降低各个类别间因像素误判而引入的误差。通过多组对比实验可知,SFDA-Net的参数量低于原UNet++,而分割精度提高了6.2个百分点,Dice得分提高了8.76个百分点,类别平均像素准确率（mPA）提升至84.09%,平均交并比（mIoU）提升至75.79%。SFDA-Net在降低参数量的同时稳步提高了网络性能,实现了更为准确的超声心动图分割。相似文献

15.

注意力机制下密集空洞卷积的肺部图像分割

下载免费PDF全文

郭宁柏正尧《中国图象图形学报》2021,26(9):2146-2155

目的卷积神经网络（convolutional neural network,CNN）在计算机辅助诊断（computer-aided diagnosis,CAD）肺部疾病方面具有广泛的应用,其主要工作在于肺部实质的分割、肺结节检测以及病变分析,而肺实质的精确分割是肺结节检出和肺部疾病诊断的关键。因此,为了更好地适应计算机辅助诊断系统要求,提出一种融合注意力机制和密集空洞卷积的具有编码—解码模式的卷积神经网络,进行肺部分割。方法将注意力机制引入网络的解码部分,通过增大关键信息权重以突出目标区域抑制背景像素干扰。为了获取更广更深的语义信息,将密集空洞卷积模块部署在网络中间,该模块集合了Inception、残差结构以及多尺度空洞卷积的优点,在不引起梯度爆炸和梯度消失的情况下,获得了更深层次的特征信息。针对分割网络常见的特征丢失等问题,对网络中的上/下采样模块进行改进,利用多个不同尺度的卷积核级联加宽网络,有效避免了特征丢失。结果在LUNA （lung nodule analysis）数据集上与现有5种主流分割网络进行比较实验和消融实验,结果表明,本文模型得到的预测图更接近于标签图像。Dice相似系数、交并比（intersection over union,IoU）、准确度（accuracy,ACC）以及敏感度（sensitivity,SE）等评价指标均优于对比方法,相比于性能第2的模型,分别提高了0.443%,0.272%,0.512%以及0.374%。结论本文提出了一种融合注意力机制与密集空洞卷积的肺部分割网络,相对于其他分割网络取得了更好的分割效果。相似文献

16.

基于视觉注意机制的彩色图像分割

下载免费PDF全文

张华伟郑娅峰张巧荣《计算机工程与应用》2011,47(10):154-157

提出一种基于视觉注意机制的彩色图像分割方法。受生物学启发,该方法模仿人类自下而上的视觉选择性注意过程,提取图像的底层特征,构造相应的显著图。根据显著图,检测出图像中的显著区域;将显著区域和背景分离,即得到图像分割结果。在多幅自然图像上进行实验,结果表明,该方法能够取得与人类视觉系统一致的分割结果。相似文献

17.

Quadratic polynomial guided fuzzy C-means and dual attention mechanism for medical image segmentation

《Displays》2021

Medical image segmentation is the most complex and important task in the field of medical image processing and analysis, as it is linked to disease diagnosis accuracy. However, due to the medical image's high complexity and noise, segmentation performance is limited. We propose a novel quadratic polynomial guided fuzzy C-means and dual attention mechanism composite network model architecture to address the aforementioned issues (QPFC-DA). It has mechanisms for channel and spatial edge attention, which guide the content and edge segmentation branches, respectively. The bi-directional long short-term memory network was added after the two content segmentation branches to better integrate multi-scale features and prevent the loss of important features. Furthermore, the fuzzy C-means algorithm guided by the quadratic polynomial can better distinguish the image's weak edge regions and has a degree of noise resistance, resulting in a membership matrix with less ambiguity and a more reliable segmentation result. We also conducted comparison and ablation experiments on three medical data sets. The experimental results show that this method is superior to several other well-known methods. 相似文献

18.

一种融合多级特征信息的图像语义分割方法

冯兴杰孙少杰《计算机应用研究》2020,37(11):3512-3515

卷积神经网络因为其强大的学习能力,已经在语义分割任务中取得了显著的效果,但是如何有效地利用网络在浅层次的视觉特征和深层次的语义特征一直是研究的热点,以此为出发点,提出了一种融合多级特征信息的图像语义分割方法。通过空洞卷积提取各层级的特征,并不断迭代深层特征来丰富低级视觉信息,最后与高级语义特征合并融合,得到精细的语义分割结果。实验在PASCAL VOC 2012数据集上与主流的五种方法进行了比较,在GTX1080Ti的环境下该方法与其中性能第二的模型mIoU（mean intersection-over-union）值相比提高了2.1%,与其中性能第一的模型mIoU值仅相差0.4%,表明该方法能有效利用多层级的特征信息,实现了图像语义分割的目的。相似文献