期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

杨泽鹏解凯李桐《光学学报》2022,(5):252-264

颜色恒常性是实现目标检测、三维物体重建、自动驾驶等计算机视觉任务的重要前提。为充分利用图像中不同尺度的特征信息估计光源,提出渐进式多尺度特征级联融合颜色恒常性算法,通过三个卷积网络分支从不同尺度提取图像中的特征信息,通过特征融合得到更加丰富的特征信息,通过级联方式将图像中的浅层边缘信息和深层细粒度特征信息进行融合,提高了颜色恒常性算法的精确性。渐进式网络结构基于加权累计角度误差损失函数提高了算法在面对极端场景光照下光源估计的鲁棒性。在重处理的ColorChecker和NUS-8数据集上的实验结果表明,本文算法在各项评价指标上均优于目前的颜色恒常性算法,可应用于需要进行颜色恒常性预处理的其他计算机视觉任务。相似文献

2.

基于多尺度残差注意力网络的水下图像增强

陈清江王炫钧邵菲《应用光学》2024,(1):89-98

针对水下图像由水的散射、吸收引起的色偏、色弱、信息丢失问题,提出了一种基于多尺度残差注意力网络的水下图像增强算法。该网络引入了改进的UNet3+-Avg结构与注意力机制,设计出多尺度密集特征提取模块与残差注意力恢复模块,以及由Charbonnier损失和边缘损失相结合的联合损失函数,使该网络得以学习到多个尺度的丰富特征,在改善图像色彩的同时又可保留大量的物体边缘信息。增强后图像的平均峰值信噪比(PSNR)达到23.63 dB、结构相似度(SSIM)达到0.93。与其他水下图像增强网络的对比实验结果表明,由该网络所增强的图像在主观感受与客观评价上都取得了显著的效果。相似文献

3.

基于扩张卷积注意力神经网络的高光谱图像分类 总被引：1，自引：0，他引：1

《光学学报》2021,41(3):43-53

为了解决训练样本有限情况下高光谱图像分类精度低的问题,提出了一种结合扩张卷积与注意力机制的三维-二维串联卷积神经网络模型。首先,该模型以串联的三维-二维卷积神经网络作为基础结构,利用三维卷积同时提取高光谱图像的空谱特征,并采用二维卷积进一步提取高级空间语义信息;然后,通过引入扩张卷积增大卷积核感受野,构建了多尺度特征提取结构,实现了多尺度特征的融合;最后,利用注意力机制使网络关注重要的空谱特征,并抑制噪声和冗余信息。在两个常用数据集上对本文算法和四种基于深度学习的分类算法进行对比实验,结果表明,所提模型取得了最准确的分类结果,有效提高了训练样本有限条件下的分类精度。相似文献

4.

基于多尺度递归网络的图像超分辨率重建 总被引：1，自引：0，他引：1

吴磊吕国强薛治天盛杰超冯奇斌《光学学报》2019,39(6):82-89

提出了一种基于多尺度递归网络的图像超分辨率网络模型,该模型主要由多个多尺度特征映射单元级联而成,每个单元分别包含一组不同尺度的特征提取层、一个融合层以及一个特征映射层。特征提取直接在原始低分辨率图像上进行,最后采用亚像素卷积重构高分辨率图像。训练阶段使用自适应矩估计优化方法加速网络模型的收敛。实验结果表明,所提算法取得了较好的超分辨率结果,图像纹理清晰、边缘锐利,视觉效果明显得到增强。在Set5、Set14、BSD100以及Urban100等常用测试集上的客观评价指标(PSNR和SSIM)均高于现有的几种主流算法。相似文献

5.

结合卷积神经网络与混响时间注意力机制的混响抑制

下载免费PDF全文

孙兴伟李军锋颜永红《声学学报》2021,46(6):1234-1241

提出一种结合卷积神经网络的编解码器模型和混响时间注意力机制的混响抑制算法,该算法通过编解码器模型实现混响抑制,并利用混响时间注意力机制克服混响环境变化对混响抑制效果的影响。该算法在编码器中使用具有不同大小的卷积核来处理混响语音幅度谱,从而获得包含多尺度上下文信息的编码特征;通过引入注意力模块,实现在不同的混响时间环境中选择性地使用不同权重的编码特征生成加权特征;最后,在解码器中使用加权特征来重建混响抑制后的语音信号幅度谱。在模拟和真实的混响环境下,该算法相对于基线系统在语音混响调制能量比上分别取得了0.36 dB和0.66 dB的提升。实验结果表明,该算法可以适应不同混响环境的变化,相对基线系统在真实混响环境下具有更高的鲁棒性。相似文献

6.

基于特征重聚焦网络的多尺度近岸舰船检测

刘荻张焱赵琰石志广张景华张宇《光学学报》2021,41(22):129-141

针对监控视频中的多尺度近岸舰船检测问题,提出了一种基于特征重聚焦网络的舰船目标检测算法,设计了由多维特征聚合模块(MFAM)与注意力特征重构模块(AFRM)组成的特征重聚焦策略.其中,MFAM基于输入的特征金字塔构建特征聚合块,进一步融合多尺度舰船不同层次特征的语义信息.AFRM基于多分支空洞卷积以及通道与空间注意力机制提升网络对目标非局部信息的表征和对背景干扰的抑制,并构建了用于目标检测的特征重聚焦金字塔.在Seaships7000舰船公开数据集上的实验结果表明,相比其他算法,本算法对监控视频中多尺度近岸舰船的检测效果更好. 相似文献

7.

基于多尺度空洞卷积的对抗去雾网络

下载免费PDF全文

丛晓峰章军胡强《应用光学》2020,41(6):1207-1213

雾天拍摄的图像存在颜色失真、图像细节模糊的问题，对成像设备采集到的图像质量造成了负面印象。针对雾天搜集图像存在的降质问题，提出了一种基于多尺度空洞卷积的对抗去雾网络。去雾网络的生成器由不同空洞率的卷积模块组成，结合多尺度的策略增加感受野并增强去雾效果；判别器采用多个卷积模块构成，用于区分生成的去雾图像与真实无雾图像；通过计算去雾图像和真实无雾图像之间的感知距离，优化图像的纹理结构并减少噪声信号。实验结果显示，提出算法在公开数据集上获得的峰值信噪比值为22.410 dB，结构相似性值为0.844，色差值为10.545。定量和定性评估表明，采用空洞卷积和感知损失技术设计的去雾网络能够有效地恢复图像的颜色信息和纹理结构。相似文献

8.

基于多尺度双阶段网络的图像超分辨率重建

下载免费PDF全文

陈清江尹乐璇邵罗仡《应用光学》2023,(6):1343-1354

针对目前图像超分辨率重建算法中所存在的特征信息提取不充分、重建图像细节信息模糊等问题,提出了一种多尺度双阶段网络来实现图像的超分辨率重建。首先,考虑到单尺度卷积层会出现特征信息提取不充分的现象,故而以多尺度卷积层为大体框架,设计网络模型;其次,考虑到重建后的图像效果,将整体网络分为2个阶段,第1阶段根据输入的低分辨率图像进行特征信息的提取和重建,第2阶段对重建后的图像进行更深一步的特征细化,从而提高重建图像的视觉效果;整体网络中还引入了跳跃连接和注意力模块,以加强特征信息的有效传播;最后,以数据集Set5、Set14、Urban100、BSDS100和Manga109作为测试集展开实验,峰值信噪比和结构相似度作为图像质量的评价指标。实验结果表明,二者的值相比以往均有所提高,且重建图像视觉效果较好。因此,该算法在客观评价和主观视觉上都取得了较好的结果。相似文献

9.

基于注意力残差编解码网络的动态场景图像去模糊

下载免费PDF全文

杨飞璠李晓光卓力《应用光学》2021,42(4):685-690

动态场景下的图像去模糊技术是一个具有挑战性的计算机视觉问题。模糊图像不仅影响主观感受,还会影响后续的智能化分析的性能。提出了一种基于注意力残差编解码网络的动态场景图像去模糊方法。首先,编码阶段采用多个残差模块提取特征,加入空间注意力模块感知模糊的空间位置信息;其次,通过在网络中采用全局-局部残差连接策略融合多层卷积特征,减少信息丢失;最后,解码阶段生成具有清晰边缘结构的复原图像。实验结果显示,提出的算法在公开数据集上获得的峰值信噪比值为31.76 dB,结构相似性值为0.912。客观和主观质量评估表明,本文算法能够有效地复原包含丰富边缘轮廓信息的清晰图像,在对比算法中获得最优的性能。相似文献

10.

基于特征融合的遥感图像舰船目标检测方法

史文旭江金洪鲍胜利《光子学报》2020,49(7):51-61

针对常用的目标检测算法对遥感图像中的舰船目标进行检测时存在检测精度与实时性兼顾不佳的问题,提出了基于特征融合的遥感图像舰船目标检测算法来检测复杂场景下的多尺度舰船目标.该算法以多尺度单发射击检测框架为基础,增加反卷积特征融合模块和池化特征融合模块,增强网络特征提取的能力.同时设计聚焦分类损失函数来解决训练过程中正负样本失衡的问题.在高分遥感舰船目标数据集上的实验结果表明,所提方法能够有效地增强复杂场景下舰船目标的检测精度.此外,该算法对遥感图像中的模糊舰船目标的检测效果也优于多尺度单发射击检测框架. 相似文献

11.

基于深度跳跃级联的图像超分辨率重建

袁昆鹏席志红《光学学报》2019,39(7):235-244

针对模型VDSR(very deep super resolution)收敛速度慢,训练前需要对原始图像进行预处理,以及网络中存在的冗余性等问题,提出了一种基于深度跳跃级联的单幅图像超分辨率重建(DCSR)算法。DCSR算法省去了图像预处理,直接在低分辨率图像上提取浅层特征,并使用亚像素卷积对图像进行放大;通过使用跳跃级联块可以充分利用每个卷积层提取到图像特征,实现特征重用,减少网络的冗余性。网络的跳跃级联块可以直接从输出到每一层建立短连接,加快网络的收敛速度,缓解梯度消失问题。实验结果表明,在几种公开数据集上,所提算法的峰值信噪比、结构相似度值均高于现有的几种算法,充分证明了所提算法的出色性能。相似文献

12.

基于注意力机制的多曝光图像融合算法

白本督李俊鹏《光子学报》2022,(4):336-347

针对多曝光图像任务缺乏真值图像,以及现有多曝光图像融合算法存在的边缘特征丢失、细节模糊等问题,本文提出了一种基于注意力机制的多曝光图像融合算法.该算法建立权重独立的双通道Unet网络,对目标场景不同曝光图像分别进行特征提取,生成不同曝光图像的高维多尺度特征图;通过视觉注意力机制凸显目标场景在不同曝光下对融合有利的特征,... 相似文献

13.

多局部残差连接注意网络的图像去模糊

下载免费PDF全文

陈清江王巧莹《应用光学》2023,44(2):337-344

针对现有的基于卷积神经网络的图像去模糊算法存在图像纹理细节恢复不清晰的问题,提出了一种基于多局部残差连接注意网络的图像去模糊算法。首先,采用一个卷积层进行浅层特征提取;其次,设计了一种新的基于残差连接和并行注意机制的多局部残差连接注意模块,用于消除图像模糊并提取上下文信息;再次,采用一个基于扩张卷积的成对连接模块进行细节恢复;最后,利用一个卷积层重建清晰图像。实验结果表明：在GoPro数据集上的PSNR (peak signal to noise ratio)和SSIM (structure similarity)分别为31.83 dB、0.927 5,在定性和定量两方面都表明所提方法能够有效地恢复模糊图像的纹理细节,网络性能优于对比方法。相似文献

14.

红外与可见光图像交互注意力生成对抗融合方法

王志社邵文禹杨风暴陈彦林《光子学报》2022,(4):310-320

为了解决生成对抗融合方法获得的融合图像不能同时保留红外图像典型目标和可见光图像纹理细节的问题,提出一种红外与可见光图像交互注意力生成对抗融合方法.首先,在生成网络模型中采用权重参数共享的双路编码器架构,利用多尺度聚合卷积模块提取源图像各自的深度特征;其次,在融合层设计上,利用交互注意力融合模型建立两类图像局部特征的全局... 相似文献

15.

基于改进旋转区域生成网络的遥感图像目标检测

《光学学报》2020,(1)

为了实现遥感图像中目标的快速准确检测,解决遥感图像目标带有旋转角度的问题,在卷积神经网络理论的基础上,将旋转区域网络生成融入到Faster R-CNN网络中,提出了一种基于Faster R-CNN改进的遥感图像目标检测方法。相对于主流目标检测方法,本文算法针对遥感图像中的大多数目标都具有方向性不定且相对聚集的特点,在区域候选网络中加入了旋转因子,以便能够生成任意方向的候选区域;同时,在网络的全连接层之前增加一个卷积层,以降低其特征图参数,增强分类器的性能,避免出现过拟合。将本文算法与几种主流目标检测方法进行对比分析后可知,本文算法因融合了多尺度特征及旋转区域网络的卷积神经网络所提取的特征,能得到更好的检测结果。相似文献

16.

基于邻域像素注意力机制的光场深度估计方法

林曦郭阳赵永强姚乃夫《光学学报》2023,(21):225-236

通过发掘深度信息与子孔径图像邻域像素间的高度相关性,提出了一种基于邻域像素注意力机制的光场深度估计方法。首先根据光场图像的数据特性提出了一种邻域像素注意力机制,该注意力机制考虑了不同子孔径图像在同一邻域间的极几何关系,能够增强网络对遮挡像素的感知能力。其次基于注意力机制设计了一个光场子孔径图像序列特征提取模块,该模块通过三维卷积将相邻序列图像上的特征编码到特征图上,并通过注意力机制增强网络对光场图像极几何特征的学习能力。最后联合邻域像素注意力机制和特征提取模块设计了一个多分支的全卷积神经网络,该网络使用部分光场子孔径图像序列即可估计图像的深度特征。实验结果表明,所提方法在均方误差（MSE）和平均坏像素率（BP）指标上总体表现优于其他先进方法,同时得益于高效注意力机制的加入,与其他先进方法相比所提方法运行速度最快。相似文献

17.

基于三次样条插值的图像多尺度方向边缘重构 总被引：1，自引：0，他引：1

马社祥刘铁根《光学与光电技术》2005,3(6):5-8

为了检测小结构的轮廓以及大目标的边缘,将多尺度边缘检测与小波变换有机地结合起来,利用小波分析方法来研究信号的多尺度边缘特征。针对图像信号的多尺度边缘检测和重构问题,利用二进小波变换的多尺度分析特性,定义了图像在水平和垂直方向的多尺度边缘。同时,利用三次样条插值算法,提出了一种由二进小波变换在水平和垂直方向的极值重构图像信号的算法。实验结果显示多尺度重建方法与著名的交替投影算法相比,算法复杂度低,图像重建速度提高了20倍,而且重建图像质量较好,其峰值信噪比提高了1 dB以上。相似文献

18.

自适应尺度信息的U型视网膜血管分割算法

梁礼明盛校棋蓝智敏杨国亮陈新建《光学学报》2019,39(8):118-132

针对视网膜血管形态结构和尺度信息复杂多变的特点,提出一种自适应血管形态结构和尺度信息的U型视网膜血管分割算法。首先采用二维K-L(Karhunen-Loeve)变换(即霍特林变换)综合分析彩色图像三通道的频带信息,从而得到视网膜灰度图像以及多尺度形态学滤波增强血管与背景的对比度信息。然后将预处理图像经U型分割模型对图像进行端对端训练,并利用局部信息熵采样进行数据增强。该网络编码部分的密集可变形卷积结构根据上下特征层信息有效地捕捉图像中多种尺度信息和形状结构,底部金字塔型的多尺度空洞卷积扩大局部感受野,同时解码阶段带有Attention机制的反卷积网络将底层与高层特征映射有效结合,解决权重分散和图像纹理损失的问题。最后通过SoftMax激活函数得到最终的分割结果。在DRIVE(Digital Retinal Images for Vessel Extraction)与STARE(Structured Analysis of the Retina)数据集上对该算法进行了仿真,准确率分别达到97.48%与96.83%,特异性分别达到98.83%与97.75%,总体性能优于现有算法。相似文献

19.

基于稀疏编码和卷积神经网络的地貌图像分类

刘芳王鑫路丽霞黄光伟王洪娟《光学学报》2019,39(4):107-115

提出了一种基于稀疏编码和卷积神经网络的地貌场景图像分类算法;利用非下采样Contourlet变换对训练样本进行多尺度分解;在训练样本中选择图像,利用稀疏编码学习局部特征,对特征向量进行排序;选择灰度平均梯度较大的特征向量对卷积神经网络卷积核进行初始化。结果表明:所提算法可以获得比传统底层视觉特征更好的分类结果,有效避免了网络训练陷入局部最优的问题,提高了自然场景下无人机着陆地貌的分类准确率。相似文献

20.

基于改进DeepLabv3+的无人车夜间红外图像语义分割

下载免费PDF全文

刘致驿孙韶媛任正云刘训华卜德飞《应用光学》2020,41(1):180-185

为了增强无人车对夜间场景的理解能力，针对无人车在夜间获取的红外图像，提出了一种基于改进DeepLabv3+网络的无人车夜间红外图像语义分割算法。由于自动驾驶场景中的对象往往显示出非常大的尺度变化，该算法在DeepLabv3+网络的基础上，通过引入密集连接的空洞卷积空间金字塔模块，使网络生成的多尺度特征能覆盖更大的尺度范围。此外，该算法将编码器模块的多层结果拼接在译码器模块中，以恢复更多在降采样过程中丢失的空间信息和低级特征。通过端到端的学习和训练，可直接用于对夜间红外图像的语义分割。实验结果表明，该算法在红外数据集上的分割精度优于原DeepLabv3+算法，平均交并比达到80.42，具有良好的实时性和准确性。相似文献