首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
针对光照变化人脸识别问题,提出了一种基于局部归一化融合熵加权Gabor特征方法。首先,计算类熵加权向量;然后,对图像进行局部归一化,并且计算输入图像的Borda计数,从而消除低值Gabor jet比较矩阵;最后,利用投票得分策略和k近邻分类器完成人脸识别。在扩展YaleB和AR人脸数据库上进行实验评估,在AR上的识别率可接近100%,相比其它几种较新的局部特征方法,本文方法取得了更高的识别精度,并且在一定程度上减少了计算开销。  相似文献   

2.
对语音情感识别的起源及主要研究内容作了介绍,对国内外语音情感识别的研究现状作了归纳总结;对语音情感特征的提取、情感分类器的建模算法作了重点分析介绍,最后对情感识别未来发展方向进行了展望.  相似文献   

3.
本文在丢失数据技术与声学后退技术的基础上,提出了一种基于模糊规则的鲁棒语音识别方法,首先根据先验知识或假定建立特征分量的可靠程度与其概率分布之间的模糊规则,识别时观察矢量的输出概率由一个基于规则的模糊逻辑系统来得到,并针对倒谱识别系统给出了一种具体的实现方法.实验结果表明,所提识别方法的性能显著优于丢失数据技术和声学后退技术.  相似文献   

4.
Learning robust representations is critical for the success of person re-identification and attribute recognition systems. However, to achieve this, we must use a large dataset of diverse person images as well as annotations of identity labels and/or a set of different attributes. Apart from the obvious concerns about privacy issues, the manual annotation process is both time consuming and too costly. In this paper, we instead propose to use synthetic person images for addressing these difficulties. Specifically, we first introduce Synthetic18K, a large-scale dataset of over 1 million computer generated person images of 18K unique identities with relevant attributes. Moreover, we demonstrate that pretraining of simple deep architectures on Synthetic18K for person re-identification and attribute recognition and then fine-tuning on real data leads to significant improvements in prediction performances, giving results better than or comparable to state-of-the-art models.  相似文献   

5.
Several alternate linear prediction parametric representations are experimentally compared as to their vowel recognition performance. The speech data used for this purpose consist of 900 utterances of 10 different vowels spoken by 3 speakers in a/b/ -vowel- /b/ context. The cepstral coefficients representation is found to be the best linear prediction parametric representation.  相似文献   

6.
语音情感识别的研究进展   总被引:11,自引:0,他引:11  
情感在人类的感知、决策等过程扮演着重要角色.长期以来情感智能研究只存在于心理学和认知科学领域,近年来随着人工智能的发展,情感智能跟计算机技术结合产生了情感计算这一研究课题,这将大大的促进计算机技术的发展.情感自动识别是通向情感计算的第一步.语音作为人类最重要的交流媒介,携带着丰富的情感信息.如何从语音中自动识别说话者的情感状态近年来受到各领域研究者的广泛关注.本文从语音情感识别所涉及的几个重要问题出发,包括情感理论及情感分类、情感语音数据库、语音中的情感特征和语音情感识别算法等,介绍了当前的研究进展,并讨论了今后研究的几个关键问题.  相似文献   

7.
SAR图像目标识别新方法   总被引:1,自引:0,他引:1  
提出一种SAR图像目标识别新方法。首次引入BM3D方法,用于滤除原始图像中的相干斑噪声,BM3D结合了空间域和变换域去噪的优势,滤波性能优异。在特征提取步骤,将低阶Hu矩与高阶Zernike矩组合,Hu矩描述目标的粗略信息,高阶Zernike矩描述目标的细节信息,因此组合矩能够更加全面而细致地表达目标特性。使用组合矩特征训练SVM分类器,对含噪的SAR图像进行识别实验。实验结果表明:本文方法的识别率高达98.90%,优于已有的SAR目标识别方法。  相似文献   

8.
本文综合阐述了当前语音识别研究及语音识别系统的状况,并对该领域的研究方向及未来发展做了展望。  相似文献   

9.
We investigate the performance of an isolated word speech recognition (IWSR) system for degraded speech. We propose a recognition scheme which adapts itself to mild degradations in speech and improves the reliability of recognition significantly. The scheme does not use a priori information regarding the nature and extent of noise. We suggest techniques which adaptively discriminate between noisy and noise-free parameters by using a selective weighting procedure in the final distance calculation. A new measure of performance is adopted to compare several recognition schemes using small data sets. Our scheme lends itself to greater flexibility in handling degradations in speech input than do the existing recognition schemes.  相似文献   

10.
随着现代科技和计算机以及平板电脑等的发展,语音交互将成为人机通信的主要方式,而汉语在语音合成中声调是不可或缺的一个重要组成部分。在声调提取过程中首先采用改进的短时自相关函数的方法进行基音检测,同时为了能较为精确地进行浊音的基音检测,利用变长分帧的方法提取基音周期序列,并通过Matlab仿真得到了汉语语音4种声调的调型曲线。仿真结果表明,该方法所得到的调型曲线与汉语普通话声调的典型曲线较为一致。  相似文献   

11.
模型补偿技术已成功应用到噪声环境下的语音识别任务中。流行的模型补偿技术如Log-Add和Log-Normal PMC(并行模型合并)方法对动态特征参数通常只能给出近似的补偿。因此他们的识别率在较低的信噪比条件下变得很低。本文利用静态特征的导函数推导出了一种新的动态模型参数补偿方法。新的方法可以同任何已知的静态模型补偿算法结合产生出新的用于识别的噪声语音模型。实验证明这一新算法的应用,使其识别率比仅使用原有的模型补偿算法有较为明显的提高,并且新算法的复杂度较原有的模型补偿算法只有轻微的增加。  相似文献   

12.
针对T型港口特有的几何结构特征, 提出了一种极化合成孔径雷达(Synthetic Aperture Radar, SAR)图像T型港口识别方法.该方法利用基于区域统计特性的极化SAR数据水平集分割方法实现精确的海岸线提取.在此基础上通过曲线分裂归并算法提取岸线特征点, 并利用T型港口始末特征点的近距离特性实现感兴趣区域提取.然后采用基于链码的直线判断方法提取港口轮廓线段, 并通过判断轮廓平行直线和垂线特征实现T型港口的识别.使用伯克利地区TerraSAR极化SAR数据进行实验验证, 结果表明了提出算法的有效性, 能在大场景范围内正确识别出沿岸T型港口.  相似文献   

13.
在建立语音识别系统的过程中错误率评估起着非常重要的作用,传统的词错误率算法仅仅是基于最小错误率,具有显著的缺陷,因而不能准确评估系统的错误率。提出一种改进的基于最小错误率和时间信息的词错误率评估算法,能够准确评估系统的错误率,为声学模型的优化提供指导。同时列举了该评估算法在建立语音识别系统过程中的应用。  相似文献   

14.
Tone model (TM) integration is an important task for mandarin speech recognition.It has been proved to be effective to use discriminatively trained scaling factors when integrating TM scores into multi...  相似文献   

15.
王维强 《电子设计工程》2012,20(12):186-189
设计了一个嵌入式语音识别系统,该系统硬件平台以ADSP-BF531为核心,采用离散隐马尔可夫模型(DHMM)检测和识别算法完成了对非特定人的孤立词语音识别。试验结果表明,该系统对非特定人短词汇的综合识别率在90%以上。该系统具有小型、高速、可靠以及扩展性好等特点;可应用于许多特定场合,有很好的市场前景。文中讲述了该系统CODEC、片外RAM、ROM以及CPLD等与DSP的接口设计,语音识别运用的矢量量化、Mel倒谱参数、Viterbi等有关算法及其实际应用效果。  相似文献   

16.
This paper describes a method for recognizing Chinese tones in continuous speech. The first and second order differentials of the fundamental frequency logarithmically converted are used as feature parameters. A left-to-right hidden Markov modeling with five states, each of which is modeled by a single Gaussian distribution, expresses each of Chinese tones. Non-voiced portions are coded by random values normally distributed to uniformly deal with all the time frames in an utterance. Speaker dependent tone recognition was conducted for ten speakers. The average rate of 81.8% was obtained for these speakers.  相似文献   

17.
在航拍图像中自动识别机场跑道的算法   总被引:4,自引:0,他引:4  
韩军伟  郭雷 《电视技术》2002,(11):74-77
提出了一种用于在航拍图像中自动识别机场跑道的方法,首先,根据机场跑道的诸多特征,构造出机场跑道的模型,然后采用假设,检验的方法,在边缘检测后的图像中,进行搜索,连接,合并,将图像中的跑道识别出来,大量的实验证明,这种方法可以自动在航拍图像中准确,快速地识别出机场跑道。  相似文献   

18.
本文研究了凌阳SPCE061A的特定人的语音识别与控制技术,将语音识别技术应用到家居控制系统中。提出一种操作简便、易扩展、适用于家庭应用的控制方案。分析了系统的硬件组成和软件设计流程。同时在Google App Inventer平台下,介绍了基于蓝牙通信的Android智能手机控制软件的搭建。经实际测试表明,本系统成功地实现对家电的声控技术和Android智能手机远程控制。  相似文献   

19.
用不变矩实现花粉粒显微图像的归一化   总被引:1,自引:0,他引:1  
显微图像易受光照、视角、方位、噪声等的影响.在这些因素的作用下,同一类显微图像的不同变形体差距有时大于另一类图像,因此进行显微图像识别以前需要进行图像的归一化.本文推导了基于变形雅可比(p=4,q=3)-傅立叶矩的草药花粉粒显微图像的归一化标准,并对8种中蒙花药显微特征图像进行归一化实验,发现同一种花粉粒图像不同变形体归一化后的矩值方差明显小于归一化前.另外,用加权最小平均距离分类器对320个花粉粒归一化显微图像进行初步识别实验,平均识别率达97.4%.  相似文献   

20.
江太辉 《电声技术》2003,(10):44-47
介绍VSELP声码器的主要特性及在语音识别电话系统中的设计与实现,并说明VSELP算法实时实现的一些关键技术。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号