期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

刘聪许婷婷马钰同刘粤孔祥斌胡胜《光电子．激光》2023,34(2):180-189

针对表面肌电信号(surface electromyography, sEMG)手势识别使用卷积神经网络(convolutional neural network, CNN)提取特征不够充分,且忽略时序信息而导致识别精度不高的问题,本文创新性地提出了一种融合双层注意力与多流卷积神经网络(multi-stream convolutional neural network, MS-CNN)的sEMG手势识别记忆网络模型。首先,利用滑动窗口生成的表面肌电图像作为该模型的输入;然后在MS-CNN中嵌入通道注意力层(channel attention module, CAM),弱化无关信息,使网络能够更加专注sEMG的有效特征;其次,通过长短期记忆网络(long short term memory network, LSTM)对输入的特征进行时序上的激励,关注更多sEMG的时序信息,让网络在时间维度上拥有更强的学习能力;最后,采用时序注意力(time-sequence attention, TSA)层对LSTM的状态进行关注,从而更好地学习重要肌肉信息,提高手势识别精度。在NinaPro数据集上... 相似文献

2.

基于卷积神经网络与注意力机制的高光谱图像分类

高玉鹏闫伟红潘新《光电子．激光》2024,35(5):483-489

由于浅层卷积神经网络(convolutional neural network,CNN)模型感受野的限制,无法捕获远距离特征,在高光谱图像 (hyperspectral image,HSI) 分类问题中无法充分利用图像空间-光谱信息,很难获得较高精度的分类结果。针对上述问题,本文提出了一种基于卷积神经网络与注意力机制的模型(model based on convolutional neural network and attention mechanism,CNNAM),该模型利用CA (coordinate attention)对图像通道数据进行位置编码,并利用以自注意力机制为核心架构的Transformer模块对其进行远距离特征提取以解决CNN感受野的限制问题。CNNAM在Indian Pines和Salinas两个数据集上得到的总体分类精度分别为97.63%和99.34%,对比于其他模型,本文提出的模型表现出更好的分类性能。另外,本文以是否结合CA为参考进行了消融实验,并证明了CA在CNNAM中发挥重要作用。实验证明将传统CNN与注意力机制相结合可以在HSI分类问题中获得更高的分类精度。相似文献

3.

点击率的深度交叉注意力预估模型

赵佰亭梁润贾晓芬《光电子．激光》2023,34(6):586-591

为了区分不同高阶交叉特征的重要程度并剔除冗余交叉特征,提高点击率的预估精度,提出了一种深度交叉注意力预估网络(deep cross attention prediction network, DAPN)模型。它将具有稀疏高维特征的输入信息表示为低维稠密向量后,分别送入因子分解机(factorization machine, FM)和深度交叉注意力层(deep cross attention, DCA)。FM通过一阶特征和二阶特征交叉挖掘训练数据中从未出现或者很少出现的低阶交叉特征。DCA层利用缩放点积注意力机制(dot-product attention,DP＿Att)设计交叉注意力层,用于区分高阶交叉特征的重要度,并设计深度神经网络(deep neural network, DNN)实现对高阶交叉特征建模。仿真表明,DAPN在MovieLens-1m和Avazu等公开数据集上均具有良好的预估性能,它使用并行结构能同时有效地学习低阶和高阶交叉特征,提高预估精度。相似文献

4.

多尺度特征融合U-Net的遥感影像黑臭水体智能检测

刘羿漩董兴鹏何胜文魏伶伶孙中平白爽李东浩《半导体光电》2023,44(5):747-755

研究采用卫星遥感技术获取高分辨率遥感影像水体样本数据集,基于深度卷积神经网络从高分辨遥感影像中提取水体并进行黑臭水体智能监测,提出了一种改进U-Net的黑臭水体检测网络模型(IWDNet)。基于U-Net结构引入跳跃式多尺度特征融合,结合通道注意力机制、卷积注意力模块、通道与空间注意力机制生成不同多尺度特征融合注意力机制(MFFAM)模块进行对比,并引入空洞卷积扩大网络感受野,最终实现黑臭水体的识别检测。实验证明：基于跳跃式多尺度融合与CBAM注意力机制的黑臭水体检测网络(MFFCBAM-IWNet)模型有效提升了识别精度,在高分辨遥感影像水体样本数据集上表现最佳,总体精度达98.56%,Kappa系数达0.978 4。相似文献

5.

损坏图像下基于风格归一化与全局注意力的行人重识别

熊炜刘粤许婷婷孙鹏赵迪李利荣《光电子．激光》2023,34(8):833-841

针对当前网络难以应对各种损坏类型的行人图像与易丢失跨维信息的问题,提出了一种损坏图像下基于风格归一化与全局注意力的行人重识别(pedestrain re-identification, ReID)方法。该方法通过平滑极大单元的风格归一化与恢复(smooth maximum unit-style normalization and restitution, SM-SNR)模块中的实例规范化(instance normalization,IN)过滤掉域中的风格变化,同时平滑极大单元(smooth maximum unit, SMU)能使该模块更充分地从删除的信息中提取行人相关特征并将其恢复至网络中,缓解损坏图像带来的风格差异。此外,全局注意力机制(global attention mechanism, GAM)通过关注通道与空间之间的相互作用,以捕获3个维度上的显著行人特征,减少跨维信息的丢失,最终使本模型在面对行人损坏图像时的识别能力得到有效提高,且保留了在干净数据集上的竞争力。实验结果表明,本算法在损坏测试集上的各项指标与目前主流算法对比具有显著的优越性。其中,本模型与2021年的CI... 相似文献

6.

基于生成式对抗网络和多模态注意力机制的扩频与常规调制信号识别方法

王华华张睿哲黄永洪《电子与信息学报》2024,(4):1212-1221

针对低信噪比条件下的扩频与常规调制信号分类精度低的问题,该文提出一种基于生成式对抗网络(GAN)、卷积神经网络(CNN)和长短期记忆(LSTM)网络的多模态注意力机制信号调制识别方法。首先生成待识别信号的时频图像(TFIs),并利用GAN实现TFIs降噪处理;然后将信号的同相正交数据(I/Q data)与TFIs作为模型输入,并搭建基于CNN的TFIs识别支路和基于LSTM的I/Q数据识别支路;最后,在模型中添加注意力机制,增强I/Q数据和TFIs中重要特征对分类结果的决定作用。实验结果表明,该文所提方法相较于单模态识别模型以及其它基线模型,整体分类精度有效提升2%～7%,并在低信噪比条件下具备更强的特征表达能力和鲁棒性。相似文献

7.

多尺度特征与双注意力机制的高光谱影像分类

吕欢欢张峻通张辉《光电子．激光》2024,35(2):143-154

针对经典卷积神经网络(convolutional neural network,CNN) 的高光谱影像分类方法存在关键细节特征表现不足、训练需要大量样本等问题,提出一种基于多尺度特征与双注意力机制的高光谱影像分类方法。首先,利用三维卷积提取影像的空谱特征,并采用转置卷积获得特征的细节信息;然后,通过不同尺寸的卷积核运算提取多尺度特征并实现不同感受野下多尺度特征的融合;最后,设计双注意力机制抑制混淆的区域特征,同时突出区分性特征。在两幅高光谱影像上进行的实验结果表明:分别在每类地物中随机选取10%和0.5%的样本作为训练样本,提出模型的总体分类精度分别提高到99.44%和98.86%;对比一些主流深度学习分类模型,提出模型能够关注于对分类任务贡献最大的关键特征,可以获取更高的分类精度。相似文献

8.

融合多元经验模态分解与Hilbert空间填充曲线的sEMG处理方法

刘聪马钰同许婷婷胡胜孔祥斌《光电子．激光》2023,34(7):723-733

基于卷积神经网络(convolutional neural network, CNN)的表面肌电信号(surface electromygraphy, sEMG)手势识别算法通常将一维sEMG转换成二维肌电图作为CNN的输入。针对sEMG瞬时样本量偏少、以及一维sEMG转换成二维肌电图时带来的局部时序特征丢失等问题,提出了将多元经验模态分解(multivariate empirical mode decomposition, MEMD)算法与Hilbert空间填充曲线相结合的方法,以提升手势识别算法的准确率。采用开源数据集NinaPro-DB1作为实验数据集;通过MEMD算法对sEMG进行分解;将分解后的本征模态函数(intrinsic mode functions, IMFs)作为Hilbert曲线的填充域(Hilb-IMFs)映射成二维肌电图;选择DenseNet作为手势识别的基本网络。实验结果表明,提出的方法相对于传统信号升维方法在手势识别准确率上约有4%的性能提升,验证了该方法的有效性。相似文献

9.

具有自校正与注意力机制相结合的场景文本检测北大核心CSCD

孙鹏刘粤强观臣熊炜付尧李利荣《光电子．激光》2022,(12):1287-1295

在日常生活中,存在着丰富的文本信息,对这些信息的提取,能够极大地提高人们的生活品质。但自然场景中文本信息表达形式丰富多样,文本形状各异,在检测过程中存在误检、文本区域定位不准问题。针对以上不足,本文提出了一种具有自校正与注意力机制相结合的文本检测方法。首先,在ResNet50骨干网络中嵌入自校正卷积(self-calibrated convolution, SConv)及高效通道注意力(efficient channel attention, ECA),使网络能够校正全局无关信息的干扰,并集中关注于文本区域,提取更加丰富的语义信息;其次,在特征融合后加入协调注意力(coordinate attention, CA),纠正不同尺度的特征图在融合过程中产生的位置偏差。最后,通过修正后的特征图预测得到多个不同尺度的文本实例,采用渐进尺度扩展算法,求出最终检测到的文本实例。实验结果表明,在任意方向数据集ICDAR2015以及弯曲文本数据集Total-Text、SCUT-CTW1500上,相比于改进前的ResNet50综合指标F值分别提升了1.0%、5.2%、5.4%,证明了本方法具有良好的检测能力。相似文献

10.

多尺度混合注意力胶囊网络的海洋鱼类识别

许学斌刘燊莲路龙宾刘晨光《光电子．激光》2022,33(11):1158-1164

针对胶囊网络(capsule network,CapsNet)特征提取结构单一和数据处理中参数量过大的问题,提出多尺度混合注意力胶囊网络模型。首先,在网络初始端添加不同尺度的卷积核来多角度提取特征,并引入混合注意力机制,通过聚焦更具分辨性的特征区域来降低复杂背景干扰。其次,采用局部剪枝算法优化动态路由,减少参数量,缩短模型训练时间。最后,在海洋鱼类数据集F4K(Fish4Knowled ge)上验证, 结果表明,与传统残差网络(residual network50,ResNet-50)、双线性网络(bilinear convo l utional neural network,B-CNN)、分层精简双线性注意力网络(spatial transformation netw ork and hierarchical compact bilinear pooling,STN-H-CBP)以及CapsNet模型相比,该算法识别精度为98.65%,比ResNet-50模型提升了5.92%;训练时间为2.2 h,相比于CapsNet 缩短了近40 min,验证了该算法的可行性。相似文献

11.

Pulmonary tuberculosis detection model of chest X-ray images using convolutional neural network

He Jin Wang Cong Chen Zhao 《中国邮电高校学报(英文版)》2018,25(6):1-6

The primary screening for pulmonary tuberculosis mainly relies on X-ray imaging all over the world. In recent years, the incidence of pulmonary tuberculosis has rebounded. This paper proposes a convolutional neural networks (CNN) based model on the tuberculosis detection of chest X-ray images, which is used for the automatic screening of pulmonary tuberculosis. Compared with the conventional CNN, this model can be used to detect the details of images and the areas of the disease quickly and accurately. There is animprovement in the learning speed and accuracy rate of our method, so it can better complete the work of anomaly detection and it can provide more effective auxiliary decision information for the practitioners. 相似文献

12.

一种基于集成卷积神经网络的SAR图像目标识别算法

下载免费PDF全文

李汪华张贞凯《电讯技术》2023,63(12):1918-1924

针对合成孔径雷达(Synthetic Aperture Radar, SAR)图像目标识别问题，提出了一种基于集成卷积神经网络(Convolutional Neural Network, CNN)的SAR图像目标识别方法。首先对原始数据集进行数据增强的预处理操作，以扩充训练样本；接着通过重采样的方法从训练样本中获取不同的训练子集，并在训练各基分类器时引入Dropout和Padding操作，有效增强了网络泛化能力；然后采用Adadelta算法与Nesterov动量法结合的思想来优化网络，提高了网络的收敛速度和识别精度；最后采用相对多数投票法对基分类器的分类结果进行集成。在MSTAR数据集上进行的实验结果表明，集成后的模型识别准确率达到99.30%,识别性能优于单个卷积神经网络，具有较强的泛化能力和较好的稳健性。相似文献

13.

基于改进编解码网络的极化SAR地物分类

下载免费PDF全文

闫成杰王沛刘秀清《雷达科学与技术》2021,19(4):440-447

基于实数域的卷积神经网络（CNN）模型无法充分利用极化合成孔径雷达（PolSAR）图像丰富的相位信息,并且逐像素切片预测存在大量冗余计算,导致分类效率低下。针对以上问题,本文提出一种改进编解码网络模型。首先构建复数域CNN模型,并进行低采样率下的模型训练;然后构建复数域双通道编解码网络模型,引入改进空洞空间金字塔池化（IASPP）以解决多尺度地物预测问题,引入辅助通道以解决分类边缘粗糙问题;最后训练编解码网络模型,将训练好的复数域CNN模型参数传递给该模型以加速模型收敛。在基于AIRSAR平台的16类地物数据上进行实验验证,结果表明改进编解码网络相较于CNN模型具有更高的分类精度和更快的分类速度。相似文献

14.

基于多维度特征遥感图像分类方法的研究北大核心CSCD

王佳鑫任彦王盛越高晓文叶玉伟《光电子．激光》2022,(8):807-814

为了解决传统高光谱图像分类方法精度低、计算成本高及未能充分利用空-谱信息的问题,本文提出一种基于多维度并行卷积神经网络(multidimensional parallel convolutional neural network,3D-2D-1D PCNN)的高光谱图像分类方法。首先,该算法利用不同维度卷积神经网络(convolutional neural network,CNN)提取高光谱图像信息中的空-谱特征、空间特征及光谱特征;之后,采用相同并行卷积层将组合后的空-谱特征、空间特征及光谱特征进行特征融合;最后,通过线性分类器对高光谱图像信息进行精准分类。本文所提方法不仅可以提取高光谱图像中更深层次的空间特征和光谱特征信息,同时能够将光谱图像不同维度的特征进行融合,减小计算成本。在Indian Pines、Pavia Center和Pavia University数据集上对本文算法和4种传统算法进行对比实验,结果表明,本文算法均得到最优结果,分类精度分别达到了99.210%、99.755%和99.770%。相似文献

15.

基于CRNN混合神经网络的多语种识别

王瑶龙华邵玉斌杜庆治王延凯《光电子．激光》2022,33(6):620-628

在语种识别过程中,为提取语音信号中的空间特征以及时序特征,从而达到提高多语种识别准确率的目的,提出了一种利用卷积循环神经网络(convolutional recurrent neural network,CRNN)混合神经网络的多语种识别模型。该模型首先提取语音信号的声学特征;然后将特征输入到卷积神经网络(convolutional neural network,CNN) 提取低维度的空间特征;再通过空间金字塔池化层(spatial pyramid pooling layer,SPP layer) 对空间特征进行规整,得到固定长度的一维特征;最后将其输入到循环神经网络(recurrenrt neural network,CNN) 来判别语种信息。为验证模型的鲁棒性,实验分别在3个数据集上进行,结果表明:相比于传统的CNN和RNN,CRNN混合神经网络对不同数据集的语种识别准确率均有提高,其中在8语种数据集中时长为5 s的语音上最为明显,分别提高了 5.3% 和6.1%。相似文献

16.

基于全卷积神经网络的SAR图像目标分类

下载免费PDF全文

陈永生喻玲娟谢晓春《雷达科学与技术》2018,16(3):242-248

近年来,卷积神经网络(Convolutional Neural Network,CNN)在合成孔径雷达(Synthetic Aperture Radar,SAR)图像目标分类中取得了较好的分类结果。CNN结构中,前面若干层由交替的卷积层、池化层堆叠而成,后面若干层为全连接层。全卷积神经网络（All Convolutional Neural Network, A-CNN）是对CNN结构的一种改进,其中池化层和全连接层都用卷积层代替,该结构已在计算机视觉领域被应用。针对公布的MSTAR数据集,提出了基于A-CNN的SAR图像目标分类方法,并与基于CNN的SAR图像分类方法进行对比。实验结果表明,基于A-CNN的SAR图像目标分类正确率要高于基于CNN的分类正确率。相似文献

17.

基于多尺度注意力CNN的SAR遥感目标识别

下载免费PDF全文

陈禾张心怡李灿庄胤《雷达科学与技术》2021,19(5):517-525

目标识别是合成孔径雷达（Synthetic Aperture Radar,SAR）图像解译的重要步骤。鉴于卷积神经网络（Convolutional Neural Network, CNN）在自然图像分类领域表现优越,基于CNN的SAR图像目标识别方法成为了当前的研究热点。SAR图像目标的散射特征往往存在于多个尺度当中,且存在固有的噪声斑,含有冗余信息,因此,SAR图像目标智能识别成为了一项挑战。针对以上问题,本文提出一种多尺度注意力卷积神经网络,结合多尺度特征提取和注意力机制,设计了基于注意力的多尺度残差特征提取模块,实现了高精度的SAR遥感图像目标识别。该方法在MSTAR数据集10类目标识别任务中的总体准确率达到了99.84%,明显优于其他算法。在测试集加入4种型号变体后,10类目标识别任务中的总体准确率达到了99.28%,验证了该方法在复杂情况下的有效性。相似文献