首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 46 毫秒
1.
提出了一种具有较高可懂度的基于子空间的语音增强算法.现有的多数语音增强算法无法有效提高增强后语音的可懂度,一个重要原因是这些算法均只使用最小均方误差来限制语音的畸变,却忽视了不同区域语音畸变对可懂度的影响存在较大差异.为了弥补这一缺陷,提出了借助先验信噪比和增益矩阵来判断语音畸变区域,通过改变增益矩阵将对可懂度影响较大的放大倍数大于6.02dB的畸变进行幅度谱限制.客观评价表明,该算法能提高增强后语音可懂度NCM评测值.主观试听结果表明,该算法确实提高了增强后语音的可懂度.  相似文献   

2.
具有高可懂度的改进的维纳滤波的语音增强算法   总被引:1,自引:0,他引:1  
提出一种具有较高可懂度的基于维纳滤波的语音增强算法。相比于其他语音增强算法,维纳滤波法可以明显提高语音质量且含有较少的音乐噪声,但是它和其他现有语音增强算法一样,都无法有效提高语音可懂度。因为维纳滤波法和其他现有算法都过多注重噪声减少,却忽略了SNR(信噪比)的估计误差和不同的语音幅度谱畸变对可懂度有更重要的影响。为改进这些缺点,此研究依据于先验SNR和增益函数来判定SNR估计误差和语音畸变区域,然后对先验SNR小于-10 d B区域的增益函数进行修正,以及幅度谱畸变大于6.02 d B区域语音进行限制。实验证明,该算法能有效提升增强后语音可懂度NCM(归一化协方差方法)的评测值。  相似文献   

3.
提出一种与主观评价相关性较高的可懂度客观评价算法。传统的基于频域分段信噪比的可懂度评价算法与主观评价的相关性不高,原因在于没有分别计算谱衰减畸变和谱放大畸变这两种畸变。为了克服这一缺点,提出将增强语音分解为衰减畸变、放大倍数小于6.02dB的放大畸变、放大倍数大于6.02dB的放大畸变三部分,分别计算其频域信噪比,用多线性回归方法综合这三种畸变值,使其与主观可懂值的相关值达到最高。实验结果表明,用这种方法对句子的可懂度评价结果与主观评价的相关值达到0.91。  相似文献   

4.
刘鹏 《计算机系统应用》2018,27(12):187-191
提出了低信噪比下高可懂度的基于分段信噪比相对均方根(RMS)的语音增强子空间算法.现有的多数语音增强算法在低信噪比的恶劣条件下,改善带噪语音质量的同时通常会伴有语音可懂度的降低.一个重要原因是这些算法大都仅基于最小均方误差(MMSE)来抑制语音失真,却忽略了语音增强算法所导致的语音失真对差异类型语音分段的可懂度影响程度不同.为了改进这一缺点,提出了基于短时信噪比RMS对语音分段进行分类,然后调整处于信噪比中均方根语音分段的增益矩阵分量,来减小语音失真对增强语音可懂度的影响.客观评价实验说明,改进算法可以改善增强语音可懂度归一化协方差评价法(NCM)的评测值.主观试听实验说明,改进算法的确提升了增强后语音的可懂度.  相似文献   

5.
研究表明,增强后的语音与纯净语音相比,会存在两种不同类型的畸变:放大畸变和衰减畸变,而放大畸变对语音可懂度的影响较大。传统的语音增强算法大多不能有效提高语音增强后的可懂度,因为这些算法仅使用最小均方误差的方法来限制这两种畸变,从而抑制噪声,提高语音的质量,但忽略了不同的畸变类型对可懂度的影响不同。提出一种基于子空间的提高可懂度的语音增强算法,使用先验信噪比及增益矩阵来判断语音畸变的类型。同时注意到,在估计先验信噪比时会存在估计误差:高估和低估,而高估会产生放大畸变,对可懂度造成较大的影响。先对高估先验信噪比(小于-10 dB)的增益矩阵进行修正,然后再对幅度谱畸变大于0 dB及6.02 dB的语音进行不同的限制。实验表明,所提出的算法能够有效增强语音的可懂度。  相似文献   

6.
依据带噪语音中不同类型语音分段(segment)对语音整体的可懂度影响不同,提出了一种基于语音分段来分类训练深度降噪自编码器(DDAE)的语音增强算法.该算法使得DDAE模型在尽可能减小Dropout所引入的扰动对带噪语音噪声特性破坏的同时,提高了对带噪语音可懂度关键分段(中均方根分段)语音特性学习的鲁棒性,提高了增强语音的可懂度.实验结果表明,该算法较现有方法提高了增强语音可懂度的NCM值.  相似文献   

7.
对于开放型办公室语音掩蔽系统性能的评价,语言可懂度是很重要的一个方面,目前通常采取的客观评价方法是STI。将语音信号按一定时间帧长反转后得到的信号我们称为时间反转语音,时间反转语音已被作为有效掩蔽信号之一。虽然对于由平稳噪声掩蔽的语音信号,STI与主观理解的语言可懂度相关性很好。但研究发现STI不适用于估计由时间反转语音掩蔽的语音信号的语言可懂度。文章分析了STI、PESQ及mNCM客观评价方法并进行了实验,实验结果表明,PESQ及mNCM对于由反转语音掩蔽的语音信号仍能较好估计语言可懂度。文章根据客观评价结果,进一步比较了反转语音掩蔽算法的不同参数(反转帧长与信噪比)对于语言可懂度的影响。发现反转帧长的增加和信噪比的降低会导致较低的语言可懂度。  相似文献   

8.
语音可懂度是语音信号的一种重要属性,在归一化协方差评价方法(NCM)的基础之上,以相对均方根(RMS)为阈值对语音信号进行分割,对高于均方值的语音段和低于均方值的语音段进行了分段可懂度评估,同时,提出了一种新的可懂度评价模型,结合了这两种语音段对语音可懂度的相对贡献,共同评价语音的可懂度。实验结果表明,高均方语音段相对于低均方语音段对可懂度具有更高的贡献,利用新的模型将这两种语音段的评价结果进行重新结合,评价效果得到了显著提升。  相似文献   

9.
针对现有的语音可懂度评价方法不能真实贴近人耳对语音的感知过程,提出一种基于人耳听觉特性的双谱特征预测语音可懂度评价(Gammatone-bspectral speech intelligibility metric, GBSIM)算法。充分利用双谱可以检测语音信号中的非线性相位耦合,抑制非高斯信号中的高斯噪声的特性,采用可以模拟人工耳蜗模型的Gammatone滤波器组,通过滤波处理将输入的语音信号分为32个听觉子频带,用三阶统计量对每个子频带的语音信号进行双谱估计并提取单一特征值来计算语音的可懂度。实例验证结果表明,该方法对信号失真变化敏感,其评价结果与主观评价具有很高的相关度,相对于传统的语音可懂度评价算法具有更好的评价效果。  相似文献   

10.
提出了一种语音主观质量的客观评估算法,该算法在巴克谱的基础上计算原始语音与重建语音之间的失真度,并考虑了弱音帧与噪声帧的存在对语音质量评估的影响。文中同时给出了结合巴克谱失真和弱音与噪声帧比率的语音质量评估公式,并将计算结果与平均意见分(MOS)进行了比较。数值实验表明,本文提出的增强型巴克谱失真测度(IBSD)与MOS之间具有很强的相关性.能客观地评价出语音信号的主观质量,适用于各种语音编码、语音通信系统。  相似文献   

11.
马仕瑛 《计算机时代》2020,(5):27-29,37
为使更多人了解使用少数民族语音产品,有效解决我国少数民族地区与其他区域之间的语言障碍问题,促进民族间的相互交流。通过搜集资料,以国内基于语音识别技术的维吾尔语、蒙古语、藏语的语音产品为研究对象,梳理其开发和应用情况,发现目前开发的相关产品主要集中于语音输入法、语音翻译软件和转录产品三方面,在此基础上,对产品使用产生的影响进行分析,并对相关语音产品的发展前景进行展望。  相似文献   

12.
We present four techniques for modeling and animating faces starting from a set of morph targets. The first technique involves obtaining parameters to control individual facial components and learning the mapping from one type of parameter to another through machine learning techniques. The second technique is to fuse visible speech and facial expressions in the lower part of a face. The third technique combines coarticulation rules and kernel smoothing techniques. Finally, a new 3D tongue model with flexible and intuitive skeleton controls is presented. The results of eight animated character models demonstrate that these techniques are powerful and effective.  相似文献   

13.
提出了一种新颖的混合语音检索算法。利用ICA的盲分离特性,将包含两个人声音的混合语音分离成只含一个人的单一语音,以分离出来的单一语音为新样本建立新的语音库,并与基于混合语音的语音库建立链接关系。查询时,利用DTW技术进行匹配检索,实现了基于混合语音的检索功能。实验表明该方法能够在混合语音中查询到用户所要求的记录。  相似文献   

14.
提出一种基于时域基音同步叠加TD-PSOLA算法的情感语音合成系统。根据情感语音库分析总结情感规则,在此基础上利用TD-PSOLA算法对中性语音的韵律参数进行改变,并提出一种能够对基频曲线尾部形状改变的方法,使句子表达出丰富的情感。实验表明,合成出的语音具有明显的情感色彩,证明了该系统能以简单明了的方式实现情感语音的合成,有助于提高人脸语音动画表达的丰富性和生动性。  相似文献   

15.
噪声鲁棒语音识别研究综述*   总被引:3,自引:1,他引:2  
针对噪声环境下的语音识别问题,对现有的噪声鲁棒语音识别技术进行讨论,阐述了噪声鲁棒语音识别研究的主要问题,并根据语音识别系统的构成将噪声鲁棒语音识别技术按照信号空间、特征空间和模型空间进行分类总结,分析了各种鲁棒语音识别技术的特点、实现,以及在语音识别中的应用。最后展望了进一步的研究方向。  相似文献   

16.
语音情感识别研究进展*   总被引:5,自引:1,他引:4  
首先介绍了语音情感识别系统的组成,重点对情感特征和识别算法的研究现状进行了综述,分析了主要的语音情感特征,阐述了代表性的语音情感识别算法以及混合模型,并对其进行了分析比较。最后,指出了语音情感识别技术的可能发展趋势。  相似文献   

17.
基于对普通语音语料库构建方法的研究与分析,结合自然口语语音识别研究相关需求以及藏语自然口语语音的基本特点,研究设计了适用于藏语语音识别的口语语音语料库建设方案以及相应的标注规范,并据此构建了时长50小时,包含音素、半音节、音节、藏文字以及语句共5层标注信息的藏语拉萨话口语语音语料库。统计结果显示,该语料库在保留口语语音自然属性的同时,对音素、半音节等常用语音建模单元也有均衡的覆盖,为基于藏语口语语音数据的语音识别技术研究提供了可靠的数据支撑。  相似文献   

18.
针对基于隐马尔科夫(HMM,Hidden Markov Model)的MAP和MMSE两种语音增强算法计算量大且前者不能处理非平稳噪声的问题,借鉴语音分离方法,提出了一种语音分离与HMM相结合的语音增强算法。该算法采用适合处理非平稳噪声的多状态多混合单元HMM,对带噪语音在语音模型和噪声模型下的混合状态进行解码,结合语音分离方法中的最大模型理论进行语音估计,避免了迭代过程和计算量特别大的公式计算,减少了计算复杂度。实验表明,该算法能够有效地去除平稳噪声和非平稳噪声,且感知评价指标PESQ 的得分有明显提高,算法时间也得到有效控制。  相似文献   

19.
In mandarin all-syllable recognition,many insert errors occur due to the influence of non-consonant syllables.Introducing the duration model into the recognition process is a direct way to lessen these errors.But that usually could not work well as expected,for the duration is sensitive to speech rate.Hence,aiming at this problem,a novel context dependent duration distribution normalized by speech rate is proposed in this paper and applied to a speech recognition system based on the frame of improved Hidden Markov Model (HMM).To realize this algorithm,the authors employ a new method to estimate the speech rate of a sentence; then compute the duration probability combined with speech rate;and finally implement this duration information in the post-processing stage.With little change in the recognition process and resource demand,the duration model is adopted efficiently in the system.The experimental results indicate that the syllable error rates decrease significantly in two different speech corpora.Especially for the insertions,the error rates reduce about sixty to eighty percent.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号