期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

刘晓雯郭继昌郑司达《西安电子科技大学学报(自然科学版)》2023,50(1):48-57

弱监督显著性目标检测中常存在目标错检、区域检测不全和目标边界不清晰等问题。针对上述问题,提出了一种基于渐进式网络的弱监督显著性目标检测算法,将显著性目标检测分为目标定位、显著性区域完善和目标边界细化3个子任务分阶段完成。首先,将输入图像采样为3个不同尺度的图像,分别输入渐进式网络的3个阶段进行学习;其次,在目标定位阶段设计了嵌套位移多层感知机,平衡网络的全局信息与局部信息的提取能力,以更好地定位显著性目标;最后,根据显著性图的结构不受尺度变化影响的特点,设计了异尺度自监督模块和目标一致性损失函数来构建自监督机制,使网络能够输出区域完整、边界清晰的显著性图。在5个数据集上测试所提算法,其客观指标与主观评价都优于最近的弱监督算法,且在F值指标上可以达到相关全监督算法89%的性能。实验结果表明,所提算法能生成显著性区域更完整、显著性目标边界更锐利的显著性图,且具有良好的鲁棒性。相似文献

2.

融合多尺度和多头注意力的医疗图像分割方法

王万良王铁军陈嘉诚尤文波《浙江大学学报(工学版)》2022,56(9):1796-1805

为了从医疗图像中自动且准确地提取兴趣区域, 提出基于神经网络的分割模型MS²Net. 针对传统卷积操作缺乏获取长距离依赖关系能力的问题, 为了更好提取上下文信息, 提出融合卷积和Transformer的架构. 基于Transformer的上下文抽取模块通过多头自注意力得到像素间相似度关系, 基于相似度关系融合各像素特征使网络拥有全局视野, 使用相对位置编码使Transformer保留输入特征图的结构信息. 为了使网络适应兴趣区域形态的差异, 在MS²Net中应用解码端多尺度特征并提出多尺度注意力机制. 对多尺度特征图依次应用分组通道和分组空间注意力, 使网络自适应地选取合理的多尺度语义信息. MS²Net在数据集ISBI 2017和CVC-ColonDB上均取得较U-Net、CE-Net、DeepLab v3+、UTNet等先进方法更优的交并比指标, 有着较好的泛化能力. 相似文献

3.

融合上下文感知注意力的低光图像去雾网络

王柯俨成吉聪黄诗芮蔡坤伦王威然李云松《西安电子科技大学学报(自然科学版)》2023,(2):23-32

现有的低光去雾算法因受图像光照强度低、光照不均匀等影响，其去雾后的图像存在细节丢失、色彩失真等现象。针对上述问题，提出一种融合上下文感知注意力的低光图像去雾网络(ACANet)。首先，在基准网络中引入层内上下文感知注意力模块，分别从通道维度和空间维度结合全局视角辨识和加权同一尺度下的重要特征，使网络突破局部视野的约束，更加高效地提取图像纹理信息；其次，引入层间上下文感知注意力模块，通过投影操作将高级特征映射到信号子空间，以实现不同层之间多尺度特征信息的高效融合，进一步提升对图像细节的重建；最后，引入CIEDE2000色偏损失函数，通过CIELAB色彩空间对图像色调进行约束，并与L2损失一起联合优化网络，使网络准确地学习图像色彩，以解决图像的严重色偏问题。实验结果表明，所提算法在多个数据集上的客观指标均优于现有去雾算法，其峰值信噪比指标较基准网络提高了8.8%,且主观去雾效果更彻底，恢复图像细节更丰富，色彩还原度更好，更接近于真实图像。相似文献

4.

融合特征增强及多尺度损失的增量去雾算法

王科平韦金阳杨艺费树岷崔科飞《北京邮电大学学报》2022,45(2):57-64

为提高雾霾图像清晰化效果并实现去雾能力的泛化,提出一种特征增强及多尺度损失约束的网络结构,并采用增量式训练方法对网络进行训练。网络由教师网络和学生网络构成。通过学习教师网络提取的标注样本注意力信息对学生网络提取的特征进行特征增强;将标注样本多尺度语义特征作为软标签,建立多尺度语义特征损失衡量机制,与全局像素差异损失级联,构建面向特征和像素的损失函数;采用增量式训练方法,教师网络为学生网络平衡不同数据集的新旧知识提供先验约束,使网络保留原有知识的前提下,快速提高对增补数据集的泛化能力。实验结果表明,所提算法在主观视觉效果与客观评价指标上均取得了较好的效果。相似文献

5.

嵌入注意力机制并结合层级上下文的语音情感识别

程艳芬陈垚鑫陈逸灵杨益《哈尔滨工业大学学报》2019,51(11):100-107

由于情感语料问题、情感与声学特征之间关联问题、语音情感识别建模问题等因素,语音情感识别一直充满挑战性.针对传统基于上下文的语音情感识别系统仅局限于特征层造成标签层上下文细节丢失以及两层级差异性被忽略的缺陷,本文提出嵌入注意力机制并结合层级上下文学习的双向长短时记忆(BLSTM)网络模型.模型分3个阶段完成语音情感识别任务,第1阶段提取情感语音特征全集后采用SVM-RFE特征排序算法降维得到最优特征子集,并对其进行注意力加权;第2阶段将加权后的特征子集输入BLSTM网络学习特征层上下文获得最初情感预测结果;第3阶段利用情感标签值对另一独立BLSTM网络训练学习标签层上下文信息并据此在第2阶段输出结果基础上完成最终预测.模型嵌入注意力机制使其自动学习调整对输入特征子集的关注度,引入标签层上下文使其联合特征层上下文实现层级上下文信息融合提高鲁棒性,提升了模型对情感语音的建模能力,在SEMAINE和RECOLA数据集上实验结果表明:与基线模型相比RMSE和CCC均得到较好改善. 相似文献

6.

基于多尺度条件生成对抗网络血细胞图像分类检测方法

陈雪云黄小巧谢丽《浙江大学学报(工学版)》2021,55(9):1772-1781

针对血细胞图像中白细胞样本较少和生成细胞图像细节不清晰,导致检测精度较低的问题,提出基于多尺度鉴别器的条件生成对抗网络. 该网络通过生成并添加大量逼真的白细胞图像到分类检测网络训练集的方式,实现对血细胞图像的生成和分类检测. 在现有条件生成对抗网络真假鉴别器中,引入多尺度卷积核、池化域并在通道上拼接,提升鉴别器对微观细节纹理特征和宏观几何特征的鉴别能力;引入梯度相似性损失函数,以提高生成细胞图像的亮度及边缘清晰度,提升图像的真实感. 实验证明,在图像生成阶段,增加多尺度鉴别器和梯度相似性损失函数提高了生成细胞图像的质量;在图像分类检测阶段,对比仅有真实数据训练的情况,增加细胞样本多样性使细胞分类检测的平均精度由90.4%提升至94.7%. 相似文献

7.

基于多尺度特征映射网络的图像超分辨率重建

段然周登文赵丽娟柴晓亮《浙江大学学报(工学版)》2019,53(7):1331-1339

针对基于卷积神经网络的图像超分辨率重建（SRCNN）方法存在的重建网络浅、特征利用率低以及重建图像模糊等问题,提出基于多尺度特征映射网络的图像超分辨率重建方法. 多尺度特征映射网络通过学习低分辨率（LR）特征与高分辨率（HR）特征之间的映射关系,将多个尺度的LR特征映射到HR特征空间,通过特征融合来提高重建过程中对特征的利用率;该方法定义了结合逐像素损失、感知损失和对抗损失的联合损失函数,从低频内容、图像边缘和局部纹理等方面均衡提升重建图像质量. 对数据集Set5、Set14和BSD100的图片4倍下采样后进行测试,与当前主流方法进行比较和分析. 实验证明,基于生成对抗的多尺度特征映射网络在提高图像感知质量方面表现优秀,重建的图像具有更加清晰的边缘和纹理,在客观评价上具有较好的评分. 相似文献

8.

多尺度特征提取和多级别特征融合的显著性目标检测方法

黎玲利孟令兵李金宝《四川大学学报(工程科学版)》2021,53(1):170-177

目前主流的显著性目标检测方法通常采用短连接加权的方式融合多级别特征信息,这种方式无法精准有效的控制信息流的传递。而且,现有的检测方法通常采用单一的特征检测,导致显著性目标区域与背景的边界不连续、易模糊。因此,本文提出一种多尺度特征提取和多级别特征融合的显著性目标检测方法。首先,利用不同扩张率的空洞卷积获取多尺度的上下文信息,弥补单一特征检测带来的不足。其次,提出一个多级别特征融合模块,该模块有效的利用浅层特征、深层特征和全局上下文特征信息之间的分布特性进行融合,不仅可以抑制噪声的传递,而且可以更有效地恢复显著性目标的空间细节结构信息。在5个公开的数据集上进行的实验结果表明: 相比较其它13种主流的检测方法,本文方法检测的显著图边缘轮廓连续性更好、空间结构细节信息更清晰,在综合指标(F-measure)、平均绝对误差(MAE)、结构化度量(S-measure)、精准率-召回率(PR)曲线和F-score曲线等指标上均有明显的提升。相似文献

9.

基于多层级特征自适应融合的图像分割算法

袁小平何祥王小倩胡杨明《浙江大学学报(工学版)》2022,56(10):1958-1966

为了解决传统算法对医学图像分割时精度较低的问题,提出基于多层级特征自适应融合的新型FR-Unet图像分割算法. 在编码器阶段,设计采样加权模块替代传统卷积层,对图像空间信息进行逐层提取和特征融合,获得相邻像素之间的相关性和不同层次的语义信息. 在解码器阶段,设计多层级自适应融合模块,通过非线性跳跃连接逐层提取图像通道信息,自适应地融合邻近连接层的上下文信息,使各层专注不同特征信息的提取. FR-Unet在模型参数量上大幅度减少,让网络在场景部署上得到更好的支持. 实验结果表明,该网络在动物细胞分割、肝脏器官分割、皮肤病变分割等众多任务中均表现突出. 相似文献

10.

基于双网络及多尺度判决器的图像修复算法

李海燕吴自莹吴俊李海江李红松《四川大学学报(工程科学版)》2022,54(5):240-248

为了有效解决修复复杂背景及高分辨率图像时产生的边界扭曲、伪影及训练不稳定的缺陷,提出了一种基于双生成对抗网络及多尺度判决器的图像修复算法。首先,将待修复图像输入基于空洞卷积(Dilated Convolution)层的内容预测网络,以重构损失和基于生成对抗损失的全局判决器为标准,进行粗修复.然后将粗修复结果输入细节修复网络,经空洞卷积路径和感知(Contextual Attention)卷积路径解码和反卷积后,送入三个不同尺度的判决器进行优化。在公认的图像数据集上对本文算法进行训练和测试,实验结果显示：提出方法在修复背景复杂及高分辨率图像时,能生成合理的结构和清晰的纹理细节,其主客观指标均优于对比算法。相似文献

11.

结合空间上下文算法的道路场景法线区域分割

陈雪云姚渠丁启辰贝学宇黄小巧金鑫《浙江大学学报(工学版)》2021,55(11):2013-2021

针对道路场景检测忽略法线属性的问题,为了加强对空间上下文和边缘信息的利用,提出结合空间上下文算法的道路场景法线区域分割方法,将道路场景识别为路面和障碍物分别对应的水平区域和竖直区域. 在交叉熵损失函数的基础上添加障碍物增强损失,改善训练过程不同分类的权重分配,提高小区域障碍物识别率. 提出上下文改进算法优化位置关联图的矩阵计算方式,减少空间复杂度提高运算效率. 嵌入边缘上下文模块削减噪声并强化主要边缘,加强边缘信息的利用. 在自建数据集和Cityscapes数据集的实验结果表明,与主流的语义分割方法相比,本研究方法加强网络特征提取能力,能有效提高对道路法线区域的分割准确度,相较Deeplab, 交并比提高了2.1%,能简单有效地实现避障任务. 相似文献

12.

适用于目标检测的上下文感知知识蒸馏网络

褚晶辉史李栋井佩光吕卫《浙江大学学报(工学版)》2022,56(3):503-509

针对现有应用于目标检测的知识蒸馏方法难以利用目标周围上下文区域的特征信息,提出适用于目标检测的上下文感知知识蒸馏网络（CAKD Net）方法.该方法能充分利用被检测目标的上下文信息,同时沿空间域和通道域进行信息感知,消除教师网络和学生网络的差异. 该方法包括基于上下文感知的区域提纯模块（CARM）和自适应通道注意力模块（ACAM）. CARM利用上下文信息,自适应生成显著性区域的细粒度掩膜,准确消除教师网络和学生网络各自特征响应在该区域的差异;ACAM引入空间?通道注意力机制,进一步优化目标函数,提高学生网络的性能. 实验结果表明,所提方法对模型检测精确率提升超过2.9%. 相似文献

13.

结合注意力与无监督深度学习的单目深度估计

下载免费PDF全文

岑仕杰何元烈陈小聪《广东工业大学学报》2020,37(4):35-41

针对当前的无监督单目深度估计方法边界模糊的问题, 提出了一种基于双重注意力模块的网络架构。这种架构能有效利用图像特征的远程上下文信息解决深度估计中的边界模糊问题。整个框架使用基于视图合成的无监督方法训练, 模型框架包括深度估计网络与位姿估计网络, 同步估计深度和相机位姿变换。双重注意力模块嵌入在深度估计网络中, 包含位置注意力模块和通道注意力模块, 能表示远程空间位置和不同特征图间的上下文信息, 从而使网络估计出细节更好的深度信息。在KITTI数据集以及Make3D数据集上的实验结果表明, 本文的方法能有效提高单目深度估计的精度和解决深度估计边界模糊问题。相似文献

14.

基于生成对抗网络的偏转人脸转正

胡惠雅盖绍彦达飞鹏《浙江大学学报(工学版)》2021,55(1):116-123

为了提高偏转人脸转正的效果,借鉴双通道生成对抗网络（TP-GAN）双通道生成的思想,将原始网络中的深度卷积生成对抗网络（DCGAN）替换成边界均衡生成对抗网络（BEGAN）. 在传统两者对抗的网络结构中加入判别人脸身份的分类器,形成三者对抗的网络结构. 经实验对比可知,与在生成器损失函数中添加约束相比,结构上加入分类器对人脸身份一致性的保持更加有效. TP-GAN存在训练复杂、模式崩溃等难题,使用BEGAN的网络结构,可以避免这些问题,提高训练效率. 在Multi-PIE数据集及LFW上的实验结果表明,利用提出的方法能够高效地生成高质量的正面人脸图片,且保留人脸的身份特征. 相似文献

15.

基于组合损失函数的BP神经网络风力发电短期预测方法

刘芳汪震刘睿迪王锴《浙江大学学报(工学版)》2021,55(3):594-600

为了改善风电大规模并网带来的电力系统功率平衡问题,提高系统的风电消纳能力,构建了基于组合损失函数的风电功率预测神经网络模型. 为了提高原始数据信息的利用率,在模型中将数据进行分类,提出以最小化组合损失函数为目标的BP神经网络风力发电短期预测模型,由均方差损失函数、交叉熵损失函数和排序损失函数按照不同的权重比构成组合损失函数. 基于实际风场数据,对基于组合损失函数的预测模型效果进行训练和仿真验证,结果表明相较于基于单一的均方差损失函数的预测方法,提出的组合损失函数可有效提高预测精度. 相似文献

16.

Network-aware perceptual error concealment method for H.264 video with side information

马汉杰陈耀武《中南工业大学学报(英文版)》2010,17(4):816-823

In order to improve the video quality of transmission with data loss, a spatial and temporal error concealment method was proposed, which considered both the state information of the network and the perceptual weight of the video content. The proposed method dynamically changed the reliability weight of the neighboring macroblock, which was used to conceal the lost macroblocks according to the packet loss rate of the current channel state. The perceptual weight map was utilized as side information to do weighted pixel interpolation and side-match based motion compensation for spatial and temporal error concealment, respectively. And the perceptual weight of the neighboring macroblocks was adaptively modified according to the perceptual weight of the lost macroblocks. Compared with the method used in H.264 joint model, experiment results show that the proposed method performs well both in subjective video quality and objective video quality, and increases the average peak signal-to-noise ratio (PSNR) of the whole frame by about 0.4 dB when the video bitstreams are transmitted with packets loss. 相似文献

17.

Temporal Shape Error Concealment for Video Objects

于烨谢旭东陆建华郑君里陈长文《北京理工大学学报(英文版)》2008,17(3):322-329

A novel temporal shape error concealment technique is proposed, which can be used in the context of object-based video coding schemes. In order to reduce the effect of the shape variations of a video object, the curvature scale space (CSS) technique is adopted to extract features, and then these features are used for boundary matching between the current frame and the previous frame. Because the temporal, spatial and statistical video contour information are all considered, the proposed method can find the optimal matching, which is used to replace the damaged contours. The simulation results show that the proposed algorithm achieves better subjective, objective qualities and higher efficiency than those previously developed methods. 相似文献