首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 265 毫秒
1.
为解决现有多数视频人体动作识别3D卷积方法无法区分信息中各维度的重要和非重要特征问题,提出了通过门控循环单元(GatedRecurrentUnit,GRU)和空间注意力增强模块构建时空特征处理网络的方法,基于多级特征融合和多组通道注意力特征选择构建网络,改进基础网络模型Res Net3D对视频人体动作识别中的网络模型.改进后模型在2个公开数据集UCF101和HMDB51上的准确率分别为96.42%和71.08%,与C3D、Two-stream等网络模型相比,具有更高的识别准确率.  相似文献   

2.
人脸微表情具有持续时间短,运动幅度小,只发生在面部局部区域的特点,给微表情的准确识别带来了极大的挑战。针对上述问题,提出一种基于持续时空注意力网络(Continuous Spatiotemporal Attention Network, CSTN)的人脸微表情识别算法。该算法由主、副两个通道组成,主通道为持续时空注意力模块,副通道为位置校准模块。首先主通道进行离散采样,等间隔抽取原始视频帧组成一个新的视频序列,利用帧间差分法提取各帧之间的运动差异,再将其输入到持续时空网络,提取面部肌肉运动的时空特征;其次利用副通道提取的面部位置信息对主通道信息进行位置校准,最后将融合信息输入到Softmax分类器对微表情进行分类。实验表明在3个公开微表情数据集CASMEⅡ,SAMM,MMEW上该算法识别的平均准确度分别达到了89.96%,86.73%,89.76%,优于现有其他算法。  相似文献   

3.
中国手指语的识别使听力障碍人群与听力正常人群相互交流和人机交互更加便捷.传统的手指语识别对环境背景要求较高,为了解决复杂环境下中国手指语的识别问题,构建并扩展了手指语图片训练集,提出基于改进的区域的全卷积网络R-FCN解决复杂背景下的手指语识别任务.为适应多变的复杂场景,利用在线难例挖掘技术对手指语识别过程中产生的难例进行在线学习,结合手指语特征对网络进行优化.并与SVM分类和FasterR-CNN神经网络作对比.实验结果表明,基于改进的R-FCN在复杂环境的手语识别任务上能达到较好的识别效果.  相似文献   

4.
土地利用信息是国土资源管理的基础和重要依据,随着高分辨率遥感图像数据的日益增多,迫切需要快速准确的土地利用分类方法。目前应用较广的面向对象的分类方法对空间特征的利用尚不够充分,在特征选择上存在一定的局限性。为此,提出一种基于多尺度学习与深度卷积神经网络(deep convolutional neural network,DCNN)的多尺度神经网络(multi-scale neural network,MSNet)模型,基于残差网络构建了100层编码网络,通过并行输入实现输入图像的多尺度学习,利用膨胀卷积实现特征图像的多尺度学习,设计了一种端到端的分类网络。以浙江省0.5 m分辨率的光学航空遥感图像为数据源进行了实验,总体分类精度达91.97%,并将其与传统全卷积网络(fully convolutional networks,FCN)方法和基于支持向量机(support vector machine,SVM)的面向对象方法进行了对比,结果表明,本文所提方法分类精度更高,分类结果整体性更强。  相似文献   

5.
土地利用信息是国土资源管理的基础和重要依据,随着高分辨率遥感图像数据的日益增多,迫切需要快速准确的土地利用分类方法。目前应用较广的面向对象的分类方法对空间特征的利用尚不够充分,在特征选择上存在一定的局限性。为此,提出一种基于多尺度学习与深度卷积神经网络(deep convolutional neural network,DCNN)的多尺度神经网络(multi-scale neural network,MSNet)模型,基于残差网络构建了100层编码网络,通过并行输入实现输入图像的多尺度学习,利用膨胀卷积实现特征图像的多尺度学习,设计了一种端到端的分类网络。以浙江省0.5 m分辨率的光学航空遥感图像为数据源进行了实验,总体分类精度达91.97%,并将其与传统全卷积网络(fully convolutional networks,FCN)方法和基于支持向量机(support vector machine,SVM)的面向对象方法进行了对比,结果表明,本文所提方法分类精度更高,分类结果整体性更强。  相似文献   

6.
作为世界六大古文字之一的古彝文记录了几千年来人类的发展历史。通过对古彝文的识别能够将这些珍贵文献资料转换为电子文档,便于保存和传播。由于历史发展、区域限制等原因,针对古彝文识别的研究鲜有成果。本文将当前新颖的深度学习技术应用于古老的文字识别。在四层卷积神经网络(convolutional neural network, CNN)基础上扩展出5个模型,然后利用Alpha-Beta散度作为惩罚项,对5个模型的输出神经元重新进行自编码,接着用2个全连接层完成特征压缩,最后在softmax层对古彝文字符特征进行重新评分,得到其概率分布,选择对应的最高概率作为识别的字符。实验表明,相对于传统CNN模型,本文方法对古彝文手写体的识别精度更高。  相似文献   

7.
作为世界六大古文字之一的古彝文记录了几千年来人类的发展历史。通过对古彝文的识别能够将这些珍贵文献资料转换为电子文档,便于保存和传播。由于历史发展、区域限制等原因,针对古彝文识别的研究鲜有成果。本文将当前新颖的深度学习技术应用于古老的文字识别。在四层卷积神经网络(convolutional neural network, CNN)基础上扩展出5个模型,然后利用Alpha-Beta散度作为惩罚项,对5个模型的输出神经元重新进行自编码,接着用2个全连接层完成特征压缩,最后在softmax层对古彝文字符特征进行重新评分,得到其概率分布,选择对应的最高概率作为识别的字符。实验表明,相对于传统CNN模型,本文方法对古彝文手写体的识别精度更高。  相似文献   

8.
中文词性标注具有重要的作用,它的准确性和标注速度直接影响到自然语言处理的后续任务.提出一种基于CNN(convolutional neural network)和LSTM(long-short term memory)混合模型进行中文词性标注.该模型采用三层结构,用词向量和CNN的滑动窗口特性产生词语表示特征,LSTM的时序性来产生词性标注的序列标签.分别在PFR《人民日报》语料库、CTB7.0和CoNLL09语料库上对该模型进行测试,在未加入任何人工特征的条件下,对词语进行词性标注,词性标注效果好于HMM(hidden Markov model)、MLP(multi-layer perceptron)、CNN和LSTM.  相似文献   

9.
针对移动自组网络(mobile Ad hoc network,MANET)的数据传输机制和数据吞吐量问题,提出了一种MANET中基于二次置换多项式的滑动窗口网络编码(quadratic permutation polynomials-based sliding window network coding,QPPSWNC)算法。该算法根据QPP理论优化滑动窗口的大小,对进入滑动窗口中的分组进行网络编码操作,恢复原始数据分组,降低每个滑动窗口的编码/解码复杂性。利用NS-2仿真器进行了仿真实验,分析本文算法性能。仿真实验结果表明,相较于典型的Block-LDPC和ACODI算法,本文算法可以优化MANET中编码开销、解码时延和网络吞吐量等性能。  相似文献   

10.
提出了基于2D图像模糊识别的3D模型检索的方法。该方法根据人识别习惯模式,从6个方向采集3D模型的2D图像。考虑到人眼对色差的敏感的特点,采用适当的均匀色空间,建立各2D图像的纹理特征。然后对这些纹理特征采用模糊C-均值算法建立模糊集,这些模糊集用于模拟人对图像模糊认识,模糊集对图像变形具有鲁棒性,故提高了提取特征的稳定性和灵活性,同时改善了检索效果与人识别效果的一致性。  相似文献   

11.
在视频目标跟踪任务中,负样本缺乏、背景混杂会造成目标丢失。为解决上述问题,提出一种基于时空上下文正则的孪生网络目标跟踪算法。该算法将空间上下文信息引入到孪生网络中,并利用目标物体正样本以及背景负样本训练跟踪器,通过正则化约束,抑制跟踪器对背景的响应,突出对目标的响应,从而得到鲁棒性更强的目标跟踪器;采用时间序列多组件匹配机制,在目标外观模型受到干扰的情况下动态调整目标模型学习率,从而保证目标模板不受污染。在OTB100标准数据集上的实验表明,在混合干扰条件下,本文算法的准确率(0. 885)和成功率(0. 615)均优于其他主流跟踪算法。特别是在遮掩、运动模糊、光照变化、背景聚类和快速运动等干扰因素影响情况下,本文算法均具有较强的鲁棒性。  相似文献   

12.
在代码搜索任务中,已有的基于深度学习的算法,一方面不能有效提取代码特征和查询特征之间的细粒度交互关系,另一方面未考虑特征之间潜在的结构化特征,无法实现更精确的匹配。本文提出了一种基于交互和图注意力网络的代码搜索模型IGANCS(Interaction and Graph Attention Network based model for Code Search)。该模型通过引入基于相似度矩阵的交互机制,学习代码特征和查询特征的细粒度交互关系,实现代码与查询之间的对齐;引入图注意力机制,利用自注意力层学习代码和查询中隐藏的结构化特征,更深入地挖掘代码和查询的结构化语义;利用最大池化机制分别聚合代码特征和查询特征,提取最重要的特征信息。本文在公开的Java数据集和Python数据集上对IGANCS进行了评估。实验结果表明,IGANCS在Mean Reciprocal Rank(MRR)和SuccessRate@1/5/10指标上优于已有的基线模型。  相似文献   

13.
三维的各向异性扩散的斑点噪声滤波算法(3D SRAD)计算密集,在CPU上串行处理运行效率较低,耗时长,不能满足实时系统的需求.为解决此问题,本文基于CUDA平台提出一种并行的3D SRAD算法——3D pSRAD.该算法从数据处理,任务分配以及纹理存储器和共享存储器的使用对并行处理进行了优化.实验结果表明,3D pSRAD提高了运算效率,计算加速比在60以上.  相似文献   

14.
差分演化算法在求解复杂优化问题时具有简单、高效的优点.本文将差分演化算法用于求解一类双曲型偏微分方程的参数识别问题,并根据所求问题的特点对算法进行了若干改进:包括基于帽子函数的参数表示和个体编码方法,用于增强算法性能的一般反向学习机制和平滑算子,以及将Tikhonov正则化和全变差正则化相结合的个体适应度计算方法.数值模拟显示,本文的算法可有效求解一维双曲型偏微分方程的参数识别问题.该算法不仅获得了高质量的近似解,而且还具有较快的收敛速度.  相似文献   

15.
长江流域在我国水资源配置体系中具有重要地位,对其进行水质预测尤为重要。基于现有研究结果,结合循环神经网络(recurrent neural network,RNN)中的门控循环单元(gate recurrent unit,GRU)模型与全连接神经网络(fully connected neural network,FCNN),提出了改进的多元水质指标预测(MWQPP)模型,并用其预测长江流域水体的pH、溶解氧(DO)、高锰酸盐指数(CODMn)、氨氮(NH3-N)。基于长江流域2011—2018年23个水质监测点7 566条原始数据,经对比实验,证明了用MWQPP模型预测得到的均方根误差(RMSE)、平均绝对误差(MAE)、平均绝对百分比误差(MAPE)和决定系数(R2)均优于传统水质预测模型,有效提升了水质预测的精度,具有较好的鲁棒性,为水质预测和流域管理提供了科学支撑。  相似文献   

16.
采用改进型二进制树搜索算法,优化了二进制树搜索路径、仲裁中断信道传输及高效随机数产生器的设计,用Verilog HDL语言在RTL级对全算法模块进行了描述,并用ModelSim软件进行功能仿真及时序验证,在Stratix EP1S10F484C5器件上进行防碰撞现场可编程门阵列(FPGA)综合,使射频识别技术(RFID)系统兼容基于位碰撞及非基于位碰撞两种识别机制的硬件设计得以实现.实验结果表明:该改进算法执行效率接近50%,比传统算法具有更高的时分多址(TDMA)信号利用率及平均识别效率,能满足多标签的快速准确识别,起到良好的防碰撞作用.  相似文献   

17.
文本情绪原因识别是情感分析中一个新的研究方向,旨在从文本中自动检测出导致某一情绪产生的原因。针对循环神经网络在长文中出现的长期依赖问题,本文提出了一种基于注意力机制和双向长短时记忆(attention model and bi-directional long short-term memory,AM-BiLSTM)神经网络模型的情绪原因识别方法。该方法采用字符向量表示文本语义信息,使用BiLSTM模型提取文本特征,该过程结合了人工提取的子句特征,在训练模型时,引入了注意力机制来优化模型性能,使用softmax对子句进行分类。实验结果表明本文方法对情绪原因的识别是有效的。  相似文献   

18.
对于非盲的高斯降噪算法而言,噪声水平值是非常重要的参数。传统的噪声水平估计算法多采用复杂的处理过程操作且效率较低。为此,本文利用非线性映射能力强大的卷积神经网络实现了一种快速高斯噪声水平估计算法。该算法首先对大量原始无失真自然图像施加不同水平的高斯噪声构成噪声图像集合,将噪声图像及其对应的噪声水平值作为卷积神经网络(convolution neural network,CNN)的输入和输出,训练得到一个噪声水平估计模型。模型一旦训练完成,即可快速地估计出任意给定的噪声图像的高斯噪声水平大小,整个过程无需人工设置任何参数。实验数据表明,与经典的噪声水平估计算法相比,所提出的算法保证了一定的预测准确性,且在执行效率方面更有优势,可适用于需要噪声水平作为输入参数的非盲降噪算法。  相似文献   

19.
为解决车联网中CAN(controller area network)总线易受攻击的问题,提出了一个混合攻击入侵检测模型DGAOIDS。该模型利用无监督的DBN(deep belief nets)学习正常CAN报文数据的基础特征,并利用一个带注意力机制的GRU(gate recurrent unit)网络学习其时序特征,用单分类支持向量机对其进行分类;引入一个对电子控制单元规则学习得到的过滤器,综合过滤器与前述模型的分类结果得出最终的检测结果。实验结果表明,对于不同攻击,基于规则的过滤器的假阳率均为0;DGAO-IDS模型不仅在公开数据集HCRL中的检测结果优于对比模型HyDL-IDS和MD-LSTM,而且该模型在混合攻击数据集MixAt中的精确度达到了91.05%,与HyDL-IDS模型和MD-LSTM模型相比分别高6.55%与7.93%。  相似文献   

20.
采用基于段长分布的非齐次隐马尔可夫模型(DDBHMM)进行维吾尔语声学建模。在新语料下由于总词汇量的成倍增加导致识别时间倍增,为缩短识别时间将耗时最长的概率计算部分采用多线程机制优化了识别模块,同时加入了端点检测进行控制,并相继设计了录音模块、特征提取模块、波形显示及结果输出显示模块等,对这些模块进行集成界面化后产生了一个基于DDBHMM的维吾尔语连续语音声学层实时识别系统,并对系统进行了测试及验证.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号