排序方式: 共有92条查询结果,搜索用时 0 毫秒
2.
人脸特征的定位是计算机人脸识别中必需的一步。该文提出了一种在彩色图象中进行人脸部特征定位的新方法。该方法只取彩色图象中的红色成分作为研究对象,以简化处理及提高信噪比;首先利用对原图的垂直灰度投影曲线确定脸的左右边界,并分离出此区域的高低灰度图,以便分图定位脸部特征;接着利用对经边缘检测的高灰度图的水平灰度投影确定下颌,嘴,鼻,眼的垂直位置,然后在相应位置附近,对鼻,眼、嘴依此进行准确定位,算法最后 相似文献
3.
汉语韵律词内部音节重音的强弱对总的F0曲线的特征有很大影响。本文参考生成F0曲线的数学优化模型,提出了对由孤立单音节调型曲线串接而成的汉语韵律词的F0曲线的连续性、平滑性、曲线形状、平均值进行整体优化的x2估计方法,实现了在重音作用下的F0曲线的优化。在谐波+噪声合成系统上实验研究了汉语三音节韵律词的64种不包含轻声的调型组合和10种结尾为轻声的调型组合的F0曲线的优化效果,展示优化过程中三个控制参数——平滑因子(smooth)、音节重音强度(stress)、音节F0形状失真度(Distor-tion)对F0曲线整体形状的控制效果和参数取值的有效范围。非正式的听觉实验表明合成语音的自然度有明显提高。 相似文献
4.
5.
基于概率加权平均的Mel子带特征重建算法 总被引:1,自引:0,他引:1
本文提出基于概率加权平均的Mel子带特征数据重建算法.该算法选择K个最优重建结果的概率加权平均作为被加性噪声掩蔽的语音特征分量的估计.实验结果表明,基于概率加权平均的语音特征数据重建算法降低了重建误差,减少了帧间突变现象,增强了Mel子带特征的帧间连续性,从而显著提高了语音识别系统对加性噪声的鲁棒性能. 相似文献
6.
The perception of human languages is inherently a multi-modal process, in which audio information can be compensated by visual information to improve the recognition performance. Such a phenomenon in English, German, Spanish and so on has been researched, but in Chinese it has not been reported yet. In our experiment, 14 syllables (/ba, bi, bian, biao, bin, de, di, dian, duo, dong, gai, gan, gen, gu/), extracted from Chinese audiovisual bimodal speech database CAVSR-1.0, were pronounced by 10 subjects. The audio-only stimuli, audiovisual stimuli, and visual-only stimuli were recognized by 20 observers. The audio-only stimuli and audiovisual stimuli both were presented under 5 conditions: no noise, SNR 0 dB, - 8 dB, - 12 dB, and - 16 dB. The experimental result is studied and the following conclusions for Chinese speech are reached. Human beings can recognize visual-only stimuli rather well. The place of articulation determines the visual distinction. In noisy environment, audio information can remarkably 相似文献
7.
8.
一种全自动稳健的图像拼接融合算法 总被引:42,自引:4,他引:42
提出了一种全自动稳健的图像拼接融合算法。此算法采用Harris角检测算子进行特征点提取,使提取的精度达到了亚像素级,然后以特征点邻域灰度互相关法进行特征点匹配得到了初步的伪匹配集合,并运用稳健的RANSAC算法将伪匹配点集合划分为内点和外点,在内点域上运用LM优化算法精确地估计出了图像间的点变换关系,最后采用颜色插值对交接处进行颜色过渡。整个算法自动完成,它对有较大误差或错误的特征点数据迭代过滤,并用提纯后的数据来做模型估计,因而对图像噪声和特征点提取不准确有强健的承受能力。在参数估计时,以特征点的坐标位置误差而不是亮度误差来构造优化函数,克服了以往算法对光照的敏感性,使算法更具有实用性。实验结果表明,该算法融合效果比较理想,鲁棒性强,具有较高的使用价值。 相似文献
9.
基于小波调制尺度的语音特征参数提取方法 总被引:3,自引:0,他引:3
时频分析的理论基础上,提出了一种基于小波调制尺度特征的参数提取方法。根据人对调制谱信息的感知特性及干扰在调制谱中的特点,采用小波分析技术及归一化处理求得归一化的小波调制尺度特征参数,并以此作为语音的动态特征应用于语音识别系统。通过与MFCC一阶、二阶系数对比的汉语音节识别实验表明,该方法在抗噪声干扰和说话速率变化等方面比MFCC的一阶、二阶系数的性能优越,为提高语音识别鲁棒性提供了一种新途径。 相似文献
10.