首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.

为了挖掘基于视频的动态手势识别问题中手势的固有时空表示,提出一种3D-2D受限玻尔兹曼机(restricted Boltzmann machine,RBM)模型,以便建模手势视频数据的时空相关信息.特别地,为了更好地描述动态手势的时空特征,提出传统手工定义特征与3D-2D RBM结合的混合特征表示方法,该方法首先提取Canny-2D HOG表观特征以及光流-2D HOG运动特征,然后基于3D-2D RBM进一步学习动态手势潜在的高层时空语义特征,提升动态手势的特征描述力.融合手势外观判别和运动判别的双通道融合判别改进了单通道分类的能力.在公开的剑桥手势数据集上的实验验证了所提方法的有效性和优越性.

  相似文献   

2.
提出了用于音素识别的K子空间和时延自相关器神经网络结构,用将时延设计加入线性自相关器,以扩展音素滤波神经网络的方法,产生p维子空间,并采用迭代过程修改划分,以便捕获语音信号中的时间序列信息。这种带不分类训练过程的体系结构提供了一种高识别性能的方法,没有大多数常规语音识别神经网络所常有的网络输出值不表示候选者似然性的缺陷。通过英语音素和汉语音素的初步试验,识别正确率为84.38%,比音素滤波神经网络方法好。  相似文献   

3.
针对高斯过程的条件受限玻尔兹曼机(Gaussian-based conditional restricted Boltzmann machine, GCRBM)时序模型可以对单一种类的步态时序数据进行很好的预测,但对多类步态时序数据难以识别和预测的问题,提出一种集成卷积神经网络(convolutional neural network, CNN)和深信网(deep belief network, DBN)的步态识别与模拟方法。利用所有类步态数据训练多个不同结构的CNNs模型,利用多类数据训练多个DBNs模型学习低维特征,并通过低维特征训练多个GCRBMs模型。在步态识别与模拟时,CNNs分类器通过投票法确定步态数据的类别;通过识别到的类所对应的DBNs模型低维特征作为对应GCRBMs模型的输入预测目标数据的后期时序低维特征;利用DBNs重构阶段将后期时序低维特征模拟出步态图像。在CASIA系列步态数据集上的试验结果表明:与支持向量机(support vector machine, SVM)、集成DBN和CNN等方法相比,本研究方法的识别率有一定的提高,提出的模型能够根据步态时序预测结果模拟出真实的步态序列图像,证实了模型的有效性。  相似文献   

4.
基于集成深度学习的时间序列预测模型   总被引:1,自引:1,他引:0  
基于高斯过程的条件受限玻尔兹曼机(GCRBM)时序模型可以很好的预测单一种类时序数据,但是该模型难以预测多类别的真实高维数据。针对这个问题,提出基于集成深度学习的时间序列预测模型,对多类时序对应训练多个深可信网络(deep belief networks, DBN)模型来学习低维特征,利用低维特征对应训练多个GCRBM时序模型。预测时序时先通过训练出的一组DBN模型对目标数据进行降维并通过重建误差识别类别,然后通过识别到的类别所对应的GCRBM模型预测目标数据的后期时序。在CASIA-A步态数据集上的试验结果表明:本方法能够准确识别出步态序列,而且预测结果能够模拟出真实的步态序列,证实了本模型的有效性。  相似文献   

5.
提出了一个新的曲线性识别算法,它利用神经网络的分类辨识特性,对边缘点进行分类识别。实验结果表明:这种方法具有速度快,省空间的优点。  相似文献   

6.
基于神经网络的交通标志识别方法   总被引:2,自引:0,他引:2  
介绍了神经网络分类器的基本原理,针对3类交通标志,即禁止标志、警告标志和指示标志,提出了应用神经网络分类器进行交通标志自动识别的基本方法。神经网络分类器由两层网络联结而成,前层网络由单个BP网络完成交通标志的粗分工作,后层由3个BP网络将组分结果分别进行细分,完成识别任务。此设计结构与传统的单层分类器相比,在训练速度和识别正确率方面都有较大的提高;显然,这与神经网络在解决小规模问题时正确率高、训练速度快相符合。同时,增加新的训练样本时,只要对相应网络进行训练即可,而不必对整个网络进行重新训练。实验结果表明,基于神经网络的交通标志自动识别方法,具有很好的识别效果。  相似文献   

7.
针对当前主流的基于统计模型的语音识别系统没有使用语音产生知识的问题,通过模拟人类的语音感知理解过程提出了一种“自下而上”的基于区分性特征的音素识别方法.该方法首先根据不同音素的发音特点检测得到音素的边界信息;然后利用分类器完成语音的区分性特征检测,并根据区分性特征与音素的对应关系建立映射表;最后利用音素的边界信息得到语音段的特征序列,通过对语音段的特征序列模糊搜索匹配实现音素识别.实验结果表明,相比于传统的基于隐马尔科夫模型的音素识别方法,该方法在识别速度、鲁棒性及可扩展性等方面具有明显优势.  相似文献   

8.
9.
递归神经网络(Recurrent Neural Network,RNN)是一种具有时延反馈能力的神经网络,它可以充分利用上下文的信息来提高分类的程度,因而很适合汉语拼音的识别,但在实践中受网络规模的限制,能利用的上下文有限,所以对汉语拼音的分类效果并不理想,为此提出一种改进的RNN-时间标签递归神经网络(TTRNN)来对汉语拼音的整音节进行直接建模识别的方法;初步的实验结果不仅证明了TTRNN方法对汉语拼音这样的时序模式有很好的分类能力,而且在拼音识别方面有很强的顽健性。  相似文献   

10.
研究神经网络在战场气体特征目标识别应用中的有效算法.通过建立战场目标气体特性探测与分析系统,针对战场上不确定背景条件下气体目标的自动识别问题,在总结目标特性规律,分析BP算法的基础上,采用BP算法对分类器进行训练,改善系统对信号的探测能力.典型战场目标信号样本检验表明:利用基于神经网络的分类器来实现对战场气体目标的识别分类是可行的.  相似文献   

11.
作为典型的模式识别任务,人脸识别有着巨大的实际应用价值与市场前景。理想环境下的人脸识别已经取得不俗成绩,然而,当所处环境变化(如姿态变换、夸张表情、阴阳脸、分辨率较低)时,识别难度增加,效果也急剧变差。与此同时,现有大多数方法无法实时(在线)完成人脸识别任务,这也限制了人脸识别技术的应用。为此,该文以深度神经网络为框架,使用大规模人脸库构造了一种新型实用的多层网络应用于大规模的人脸识别任务中并提出了一种新的搜索策略。实验结果表明,该套方法实时性好,识别率较高,是人脸识别较为理想的方案。  相似文献   

12.
语音识别中深度神经网络目标值优化   总被引:1,自引:0,他引:1  
语音识别系统中,由强制对齐得到的用于训练深度神经网络声学模型的目标值,常常无法精准地表示出语音实际的情况,这是因为用于强制对齐的模型可能与处理语句不完全匹配,以及发音连续性导致的过渡边界难以分离等问题。针对这一问题,该文提出了一种利用前后向算法得到非0-1分布目标值的方法。新的目标值可以表示出某一帧以一定概率属于邻近各状态的分布情况,更详细地描述建模单元之间的过渡,进一步还原语音的原貌,提升模型的鲁棒性。同时,为寻求模型鲁棒性和建模单元区分度之间的平衡,对算法得到的目标值进行加窗处理。实验在中文客服问答领域上进行,在小数据量上验证了目标值对于训练的较大影响,并且选取了窗长宽度这一参数。最后将训练数据量提升至60小时,80小时以及100小时,结果显示新的目标值训练得到的模型在识别性能上获得了一致的提升,相对字错误率下降1.10%至3.65%。多组实验验证了新的目标值对模型训练有一定效果,在训练数据量上升的情况下依然具有有效性。  相似文献   

13.
基于改进Fisher准则的深度卷积神经网络识别算法   总被引:1,自引:0,他引:1  
为了有效利用深度学习技术自动提取特征的能力,并解决当训练样本量减少或者迭代次数降低时识别性能急速下降的问题,提出了基于Fisher准则的深度学习算法.该方法在前馈传播时,采用卷积神经网络自动提取图像的结构信息等特征,同时利用卷积网络共享权值和池化、下采样等方法减少了权值个数,降低了模型复杂度;在反向传播权值调整时,采用了基于Fisher的约束准则.在权值的迭代调整时既考虑误差的最小化,又同时让样本保持类内距离小,类间距离大,从而使权值能更加快速地逼近有利于分类的最优值,当样本量不足或训练迭代次数不多时可有效地提高系统的识别率.大量的实验结果证明:该基于Fisher准则的混合深度学习算法在标签样本不足或者较少训练次数的情况下依然能达到较好的识别效果.  相似文献   

14.
用分组神经网络识别手写体数字   总被引:1,自引:0,他引:1  
用神经网络识别手写体数字,大多数采用的是单个的神经网络结构.本文给出一个基于特征输入的手写体数字识别的分组神经网络结构,它是一个混合网络(Hybrid System).实验的结果表明,同只采用单个神经网络结构的方法相比,分组网络具有更好的识别结果.  相似文献   

15.
非线性主分量分析PCA算法与子空间模式识别方法相结合,提出了一种应用于手写体字符识别的基于非线性PCA神经网络的信号重构模型,并与BP网络模型进行了比较实验,结果表明,本文提出的方法,对于0~9手写体数字识别,正确识别率达到了94.74%,而对于a~z手写体字符识别,正确识别率达到了91.03%.  相似文献   

16.
针对BP神经网络进行脱机手写数字识别所存在的问题,提出用自组织竞争神经网络(LVQ)对脱机手写数字识别的方法.介绍了LVQ神经网络算法,并构建了LVQ神经网络的识别模型,用Matlab软件进行了仿真.将获得的仿真结果数据与BP神经网络的测试结果进行对比分析,发现LVQ神经网络对脱机手写数字的识别率明显高于BP神经网络,且收敛速度更快.该方法在脱机手写数字识别领域具有一定的可行性与指导性.  相似文献   

17.
文章对多目标进行特征提取,数据作为神经网络分类器的输入,采用不同的算法对多输出型BP神经网络分类器和单输出型BP神经网络联合分类器进行训练,实现多目标的识别。仿真试验结果表明,基于BP神经网络分类器的识别方法具有较高的识别率。  相似文献   

18.
基于BP神经网络的集装箱箱号识别   总被引:1,自引:1,他引:0  
提出一种用BP神经网络实现集装箱箱号识别的方法。提出的图像预处理方法对管柱,底面凹凸,脏污物、光线的强弱、倾斜、缺损或模糊有较强的适应性。在BP网络分类器实现时,考虑集装箱箱号的组成特点,采用并行处理方法。在BP算法中,引入动态因子,动态调整学习步长。实践证明利用这种方法来识别装箱箱号,速度快,识别率高,具有较高的实用价值。  相似文献   

19.
人工神经网络是对人脑功能的某种程度的反映,具有自适应,自学习的能力,可通过对模式样本的自学习,从中获取特征,并能将学习获得的知识应用到后来的识别中。本文采用单层离散Hopfield网络来实现衰变目标的识别,提出了选取Hopfield网络三个记忆模式方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号