期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

陈国喜周松斌陈颀刘忆森赵路路韩威《光谱学与光谱分析》2022,42(12):3811-3816

近年来,深度学习技术在近红外光谱、拉曼光谱、荧光光谱等的光谱学数据建模上取得一系列突破。由于深度学习方法对于样本数量的需求高,而在分析化学领域获得大量有标签样本较为困难,因此过拟合问题一直是深度神经网络在化学计量学中应用时研究者高度关注的问题。该工作提出基于波段注意力卷积网络(WA-CNN)的近红外数据建模方法,并应用于婴儿配方奶粉皮革水解蛋白(HLP)掺假定量分析。WA-CNN在传统卷积网络的基础上加入波段注意力模块,该模块采用卷积操作自训练波段注意力权值,并以乘法加权形式对有效波段进行激活,从而有效缓解深度神经网络在近红外数据建模中的波段信息冗余问题,达到抑制过拟合,提升预测精度的目的。研究中共测试100个皮革水解蛋白掺假婴儿配方奶粉样本的近红外光谱数据,其中皮革水解蛋白的掺假比例范围是0%～20%。采用60%的样本训练,剩余40%样本测试,随机采样10次,通过测试集均方根误差(RMSEP)、决定系数(R²)以及相对分析误差(RPD)的均值来进行模型评价。并建立偏最小二乘回归(PLS)、支持向量机回归(SVR)和常规的一维卷积神经网络(CNN)三种传统模型用于... 相似文献

2.

基于多层感知机和多尺度特征提取的肝脏分割网络

胡瑶李进王远军《光学技术》2023,(1):105-112

肝脏精准分割对于肝癌的定位与治疗至关重要,针对肝脏形状尺寸不一以及边缘和病灶区域分割难度较大等问题,提出了一个基于多层感知机和多尺度特征提取的肝脏分割网络(M2U-Net)。该网络分为卷积阶段和多层感知机阶段。在卷积阶段的编码器部分加入挤压激励模块,突出特定的肝脏分割任务,抑制无关背景区域;在多层感知机阶段加入标记化多层感知机模块,减小模型复杂度。过渡层增加了多尺度特征提取模块,适应不同尺度肝脏的分割以及细节区域的分割;在LiTS数据集和东方肝胆医院提供的数据集上的实验结果表明,此分割网络在三个评价指标上结果均优于U-Net、U-Net++和CE-Net等分割网络。相似文献

3.

基于深度注意力机制的多尺度红外行人检测

《光学学报》2020,(5)

针对多尺度目标检测问题,提出一种基于深度注意力机制的多尺度红外行人检测方法。首先,选取较为轻量级的Darknet53作为深度卷积特征提取的主干网络,设计四尺度的特征金字塔网络负责目标的定位和分类,通过引入更低层高分辨率的特征图来改善对小尺度行人目标的检测性能。其次,利用注意力模块替代特征金字塔网络中传统的上采样模块,生成基于卷积特征的局部显著图,可以有效抑制不相关区域的特征响应,突出图像局部特性。最后,利用Caltech行人数据集和U-FOV红外行人数据集进行两次迁移训练,以提高模型的泛化能力,丰富行人的样本特征。实验结果表明,所提方法在U-FOV数据集上的识别平均准确率达到了93.45%,比YOLOv3高26.74个百分点,能检测到的最小行人像素为6×13。在LTIR数据集上的定性实验结果验证,所提模型具有良好的泛化能力,适用于多尺度红外行人的检测。相似文献

4.

基于卷积神经网络的焊缝缺陷图像分类研究

下载免费PDF全文

谷静张可帅朱漪曼《应用光学》2020,41(3):531-537

为有效地对焊缝缺陷进行分类,从而判断焊接质量的等级,对传统卷积神经网络进行改进,提出一种多尺度压缩激励网络模型（SINet）。将4组两两串联的3×3卷积模块与Inception模块、压缩激励模块（SE block）相结合。通过多尺度压缩激励模块（SI module）将卷积层中的特征进行多尺度融合和特征重标定以提高分类准确率,并用全局平均池化层代替全连接层减少模型参数。此外考虑到焊接缺陷数量不平衡对准确率的影响,采用深度卷积对抗生成网络（DCGAN）进行数据集的平衡处理,并在该数据集上验证模型的有效性。与传统卷积神经网络相比,该模型具有良好的性能,在测试集上准确率达到96.77%,同时模型的参数个数也明显减少。结果表明该方法对焊缝缺陷图像能进行有效地分类。相似文献

5.

基于多尺度注意力机制相位展开的三维人脸建模

朱江平王睿珂段智涓黄怡洁何国欢周佩《光学学报》2022,(1):166-177

相位展开作为三维(3D)测量技术中的关键环节,其解析精度直接影响3D建模的精度。由于存在欠采样和相位不连续等问题,故传统空间相位展开难以得到正确的相位信息,而时间相位展开又需要额外的信息辅助。针对复杂场景中的3D人脸建模,提出了基于多尺度注意力机制的相位展开网络。在所提网络中,利用编码器-解码器结构融合多尺度特征,并在解码网络中嵌入注意力子网络以获取上下文信息。构建一个包含5000组样本的FACE数据集和一个包含100组样本的MASK数据集,每组样本均包含截断相位和连续相位的真值,这些真值可用于相位展开的训练及测试。所提网络在FACE数据集和MASK数据集上的均方根误差分别为0.0387 rad和0.0273 rad,结构相似性分别为0.9850和0.9793。在欠采样、相位不连续等区域中,所提网络可快速准确地提取相位特征,进而保证了相位展开的正确性。最后,通过对比实验证实了所提网络的有效性和可行性。相似文献

6.

融合多重自注意力和可变形卷积的多模态脑胶质瘤分割

赵欣张鑫李鑫杰王洪凯《波谱学杂志》2023,(3):280-292

脑胶质瘤的磁共振图像分割对于脑肿瘤的诊断、手术规划以及放疗等治疗方案的确定具有非常重要的意义．针对现有脑肿瘤分割算法分割精度不高边缘分割不精确,易出现假阳性的问题,本文提出一种基于多重自注意力和可变形卷积的Unet改进模型．模型将原始Unet框架的标准卷积替换为残差模块,以防止模型训练过程中出现梯度消失;通过在瓶颈层加入基于Transformer的多重自注意力模块来提取局部特征和全局上下文信息,以更好地挖掘像素间的相关性;在跨层连接处采用可变形卷积来增强模型对形状感知的敏感性,以提升肿瘤边缘特征的提取能力．实验结果表明,所提算法的分割结果评价指标高于使用同样数据集的其他对比模型,而且对肿瘤边缘的分割更加精确．这表明本文算法是一种有效的脑胶质瘤自动分割算法．相似文献

7.

基于RGBD图像和卷积神经网络的快速道路检测

《光学学报》2017,(10)

针对移动平台有限的计算资源以及基于彩色图像的道路检测方法在极端光照情况下及路面类型变化时存在的不足,提出了一种融合彩色图像和视差图像的基于9层卷积神经网络的快速道路检测算法。提出一种数据输入层预处理方法,将视差图变换为视差梯度图以强化地面特征,降低网络深度需求。所提两种网络结构为双通道后融合网络和单通道前融合网络,分别用于卷积特征分析和快速道路检测。实验使用KITTI道路检测数据集并人为划分为普通和困难两组数据集,对该算法进行实验对比和分析,结果表明:与基于彩色图像的卷积神经网络方法相比,该算法在普通数据集上最大F1指标(MaxF1)提升了1.61%,在困难数据集上MaxF1提升了11.58%,算法检测速度可达26frame/s,可有效克服光照、阴影、路面类型变化等影响。相似文献

8.

基于自适应补偿网络的视网膜血管分割

张林吴闯范心宇宫朝举李甦雁刘辉《光学学报》2023,(14):192-202

基于眼底图像的视网膜血管精确分割对眼科疾病诊断意义重大。但视网膜血管结构高度复杂,多尺度及前、背景比例失衡,自动分割困难。因此,本文提出自适应补偿网络（SACom）实现端到端的视网膜血管精确分割。SACom以U型网络为基本框架,首先在编码器端引入可变形卷积提高复杂血管结构信息学习能力;然后在U型网络底部设计自适应多尺度对齐上下文模块提取并聚合多尺度上下文信息,对齐上下文特征;最后在解码器端设计协同补偿分支,融合多级输出提升模型的映射能力,实现精细分割。实验结果表明,SACom可有效提高视网膜血管的分割精度,在DRIVE、CHASE＿DB1和STARE三个公共数据集上的准确率分别达到0.9695、0.9763和0.9753,灵敏度分别达到0.8403、0.8748和0.8506,曲线下面积（AUC）分别达到0.9880、0.9917和0.9919。相似文献

9.

增强小目标特征的多尺度光学遥感图像目标检测

单慧琳王硕洋童俊毅胡宇翔张雁皓张银胜《光学学报》2024,(6):382-394

针对光学遥感图像目标分布密集、尺度变化范围较大及小目标特征信息过少等造成目标检测精度不高、泛化能力差等问题,本文提出了一种增强小目标特征的多尺度神经网络（ESF-MNet）。首先在骨干网络中引入注意力模块构建出高效层注意力聚合结构,以增强特征提取能力;此外,在浅层特征图与颈部网络融合之前加入感受野增强模块,以捕获不同尺度的上下文信息。其次,使用GSConv构成颈部网络,减少网络层参数量,保持网络的特征提取能力,并通过基于内容感知的特征重组模块提高识别精度。最后,采用下采样率分别为4、8和16倍的三个下采样模块作为头部网络输入,来提高小目标的检测效果。为了证明该方法的有效性,在DOTA数据集和NWPU NHR-10数据集上进行实验,平均检测精度分别达78.6%和94.3%,计算复杂度为94.7 G,整体模型大小为26.2 M。该方法具备检测精度高、计算复杂度低、模型权重小等特点,能有效提高小目标的检测精度,进一步改善光学遥感图像小目标检测性能。相似文献

10.

基于扩张卷积注意力神经网络的高光谱图像分类 总被引：1，自引：0，他引：1

《光学学报》2021,41(3):43-53

为了解决训练样本有限情况下高光谱图像分类精度低的问题,提出了一种结合扩张卷积与注意力机制的三维-二维串联卷积神经网络模型。首先,该模型以串联的三维-二维卷积神经网络作为基础结构,利用三维卷积同时提取高光谱图像的空谱特征,并采用二维卷积进一步提取高级空间语义信息;然后,通过引入扩张卷积增大卷积核感受野,构建了多尺度特征提取结构,实现了多尺度特征的融合;最后,利用注意力机制使网络关注重要的空谱特征,并抑制噪声和冗余信息。在两个常用数据集上对本文算法和四种基于深度学习的分类算法进行对比实验,结果表明,所提模型取得了最准确的分类结果,有效提高了训练样本有限条件下的分类精度。相似文献

11.

基于改进DeepLabv3+的无人车夜间红外图像语义分割

刘致驿孙韶媛任正云刘训华卜德飞《应用光学》2020,41(1):180-185

为了增强无人车对夜间场景的理解能力,针对无人车在夜间获取的红外图像,提出了一种基于改进DeepLabv3+网络的无人车夜间红外图像语义分割算法。由于自动驾驶场景中的对象往往显示出非常大的尺度变化,该算法在DeepLabv3+网络的基础上,通过引入密集连接的空洞卷积空间金字塔模块,使网络生成的多尺度特征能覆盖更大的尺度范围。此外,该算法将编码器模块的多层结果拼接在译码器模块中,以恢复更多在降采样过程中丢失的空间信息和低级特征。通过端到端的学习和训练,可直接用于对夜间红外图像的语义分割。实验结果表明,该算法在红外数据集上的分割精度优于原DeepLabv3+算法,平均交并比达到80.42,具有良好的实时性和准确性。相似文献

12.

面向病理图像分割的边缘感知网络

黄鸿杨沂川王龙郑福建吴剑《光子学报》2024,(1):85-97

提出了一种针对病理切片图像的端到端语义分割方法--边缘感知网络（BPNet）,以提高病理图像分割精度。BPNet网络首先在解码器阶段增加边缘感知模块,改善网络对于病理图像边缘的特征信息提取能力。然后,采用自适应通道注意力模块弥补不同层次特征间的语义差距,进一步加强网络的特征聚合能力。在此基础上,设计了一种基于结构和边缘的联合损失函数,以实现最佳的病理图像分割结果。在GlaS和MoNuSeg两个公开病理数据集上的分割实验结果表明,所提方法的Dice系数得分在两个数据集上分别达到92.21%和81.18%,有效提升了病理图像的分割精度。相似文献

13.

基于桥接Transformer的小样本优化鸟声识别网络

下载免费PDF全文

王基豪周晓彦韩智超王丽丽《应用声学》2024,43(3):542-551

针对实际鸟类监测环境中,收集鸟声声频数据分布不均匀,导致神经网络训练不充分,分类识别测试准确率低的问题,设计了一种桥接Transformer神经网络模型。该网络首先利用原始鸟声声频信号生成短时傅里叶变换语谱图作为输入特征,之后将语谱图输入到由注意力模块和卷积模块桥接组成的Transformer网络中,完成对语谱图中全局特征和局部特征的信息交互,最后利用单层Transformer编码器实现对每一个批次样本的损失优化,得到最终的分类结果。在Birdsdata和xeno-canto鸟声数据集上进行小样本实验,分别获得了91.34%和82.63%的平均准确率,与其他鸟声识别网络进行了对比实验,验证了该网络的有效性。相似文献

14.

基于多尺度空洞卷积的对抗去雾网络

丛晓峰章军胡强《应用光学》2020,41(6):1207-1213

雾天拍摄的图像存在颜色失真、图像细节模糊的问题,对成像设备采集到的图像质量造成了负面印象。针对雾天搜集图像存在的降质问题,提出了一种基于多尺度空洞卷积的对抗去雾网络。去雾网络的生成器由不同空洞率的卷积模块组成,结合多尺度的策略增加感受野并增强去雾效果;判别器采用多个卷积模块构成,用于区分生成的去雾图像与真实无雾图像;通过计算去雾图像和真实无雾图像之间的感知距离,优化图像的纹理结构并减少噪声信号。实验结果显示,提出算法在公开数据集上获得的峰值信噪比值为22.410 dB,结构相似性值为0.844,色差值为10.545。定量和定性评估表明,采用空洞卷积和感知损失技术设计的去雾网络能够有效地恢复图像的颜色信息和纹理结构。相似文献

15.

基于Swin-Transformer迭代展开的有限角CT图像重建用于PTCT成像

袁伟席雅睿谭川东刘川江朱国荣刘丰林《光学学报》2024,(8):304-315

针对相对平行直线扫描CT(PTCT)图像重建存在的有限角伪影问题,提出一种学习局部和非局部正则项的深度迭代展开方法。该方法将具有固定迭代次数的梯度下降算法迭代展开到神经网络,利用具有坐标注意力（CA）机制的卷积模块和Swin-Transformer模块作为迭代模块交替级联部署,构成端到端的深度重建网络。卷积模块学习局部正则化,其中CA用于减少图像过平滑;Swin-Transformer模块学习非局部正则化,提高网络对图像细节的恢复能力;在相邻模块间,使用迭代连接（IC）增强模型提取深层特征的能力,提高每次迭代的效率。通过消融实验验证了网络各部分的有效性,并在两种类型的数据集上进行实验,结果证明了本文方法的效果。实验结果表明,本文方法在抑制PTCT重建图像有限角伪影的同时,能较好地保留重建图像细节,提高重建图像质量。相似文献

16.

基于特征重聚焦网络的多尺度近岸舰船检测

刘荻张焱赵琰石志广张景华张宇《光学学报》2021,41(22):129-141

针对监控视频中的多尺度近岸舰船检测问题,提出了一种基于特征重聚焦网络的舰船目标检测算法,设计了由多维特征聚合模块(MFAM)与注意力特征重构模块(AFRM)组成的特征重聚焦策略.其中,MFAM基于输入的特征金字塔构建特征聚合块,进一步融合多尺度舰船不同层次特征的语义信息.AFRM基于多分支空洞卷积以及通道与空间注意力机制提升网络对目标非局部信息的表征和对背景干扰的抑制,并构建了用于目标检测的特征重聚焦金字塔.在Seaships7000舰船公开数据集上的实验结果表明,相比其他算法,本算法对监控视频中多尺度近岸舰船的检测效果更好. 相似文献

17.

红外与可见光图像交互注意力生成对抗融合方法

王志社邵文禹杨风暴陈彦林《光子学报》2022,(4):310-320

为了解决生成对抗融合方法获得的融合图像不能同时保留红外图像典型目标和可见光图像纹理细节的问题,提出一种红外与可见光图像交互注意力生成对抗融合方法.首先,在生成网络模型中采用权重参数共享的双路编码器架构,利用多尺度聚合卷积模块提取源图像各自的深度特征;其次,在融合层设计上,利用交互注意力融合模型建立两类图像局部特征的全局... 相似文献

18.

基于特征重组的遥感图像有向目标检测

王友伟郭颖邵香迎王季宇鲍正位《光学学报》2024,(6):326-336

针对遥感有向目标存在的检测问题,设计了一个基于改进Rotated RPN的网络,设计特征重组机制,通过加权使网络关注有效目标区域。使用新的有向框标注方法,避免在临界角度出现错位等问题。在检测头前端使用极化注意力模块,改善因为分类和回归任务所需特征不一致导致的性能下降问题。实验结果表明,该模型可以提高多类目标的检测精度。相较于基准Rotated RPN,该模型在Dior-R数据集上精度提升4.95%,在HRSC2016数据集上精度提升11.75%。相似文献

19.

基于邻域像素注意力机制的光场深度估计方法

林曦郭阳赵永强姚乃夫《光学学报》2023,(21):225-236

通过发掘深度信息与子孔径图像邻域像素间的高度相关性,提出了一种基于邻域像素注意力机制的光场深度估计方法。首先根据光场图像的数据特性提出了一种邻域像素注意力机制,该注意力机制考虑了不同子孔径图像在同一邻域间的极几何关系,能够增强网络对遮挡像素的感知能力。其次基于注意力机制设计了一个光场子孔径图像序列特征提取模块,该模块通过三维卷积将相邻序列图像上的特征编码到特征图上,并通过注意力机制增强网络对光场图像极几何特征的学习能力。最后联合邻域像素注意力机制和特征提取模块设计了一个多分支的全卷积神经网络,该网络使用部分光场子孔径图像序列即可估计图像的深度特征。实验结果表明,所提方法在均方误差（MSE）和平均坏像素率（BP）指标上总体表现优于其他先进方法,同时得益于高效注意力机制的加入,与其他先进方法相比所提方法运行速度最快。相似文献

20.

基于卷积神经网络的路面裂缝分割设计与研究

刘艳宁章国宝《应用光学》2024,(2):373-384

裂缝是路面病害最主要的类型,准确的裂缝分割是国家进行公路预防养护管理的重要决策依据。针对背景复杂下现有模型路面裂缝分割准确度有待提高的问题,提出一种基于卷积神经网络的端到端裂缝分割模型,使用分层结构的ConvNeXt编码器提取多尺度特征,特征的最高层使用金字塔池化模块进一步获取全局先验特征,通过具有横向连接和自上而下的金字塔结构进行特征融合。针对裂缝和背景不平衡问题,使用平衡交叉熵损失函数提高模型的检测性能。此外,构建了一个包含2 876张裂缝图片的数据集UCrack,覆盖多种裂缝类型和广泛的背景范围,以提供丰富的特征供模型学习。实验表明,在UCrack测试数据集上模型的召回率和F1得分比其他表现最佳的模型提高了2.68%和6.89%;在CrackDataset数据集上的测试取得了85.68%的召回率和80.11%的F1得分,说明模型具有较好的泛化性能,可应对背景复杂的路面裂缝分割。相似文献