首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
研究表明,增强后的语音与纯净语音相比,会存在两种不同类型的畸变:放大畸变和衰减畸变,而放大畸变对语音可懂度的影响较大。传统的语音增强算法大多不能有效提高语音增强后的可懂度,因为这些算法仅使用最小均方误差的方法来限制这两种畸变,从而抑制噪声,提高语音的质量,但忽略了不同的畸变类型对可懂度的影响不同。提出一种基于子空间的提高可懂度的语音增强算法,使用先验信噪比及增益矩阵来判断语音畸变的类型。同时注意到,在估计先验信噪比时会存在估计误差:高估和低估,而高估会产生放大畸变,对可懂度造成较大的影响。先对高估先验信噪比(小于-10 dB)的增益矩阵进行修正,然后再对幅度谱畸变大于0 dB及6.02 dB的语音进行不同的限制。实验表明,所提出的算法能够有效增强语音的可懂度。  相似文献   

2.
提出了一种具有较高可懂度的基于子空间的语音增强算法.现有的多数语音增强算法无法有效提高增强后语音的可懂度,一个重要原因是这些算法均只使用最小均方误差来限制语音的畸变,却忽视了不同区域语音畸变对可懂度的影响存在较大差异.为了弥补这一缺陷,提出了借助先验信噪比和增益矩阵来判断语音畸变区域,通过改变增益矩阵将对可懂度影响较大的放大倍数大于6.02dB的畸变进行幅度谱限制.客观评价表明,该算法能提高增强后语音可懂度NCM评测值.主观试听结果表明,该算法确实提高了增强后语音的可懂度.  相似文献   

3.
一种改进的维纳滤波语音增强算法   总被引:1,自引:0,他引:1       下载免费PDF全文
提出了一种改进的语音增强算法,该算法以基于先验信噪比估计的维纳滤波法为基础。首先通过计算无声段的统计平均得到初始噪声功率谱;其次,计算语音段间带噪语音功率谱,并平滑处理初始噪声功率谱和带噪语音功率谱,更新了噪声功率谱;最后,考虑了某频率点处噪声急剧增大的情况,通过计算带噪语音功率谱与噪声功率谱的比值,自适应地调整噪声功率谱。将该算法与其他基于短时谱估计的语音增强算法进行了对比实验,实验结果表明:该算法能有效地减少残留噪声和语音畸变,提高语音可懂度。  相似文献   

4.
深度神经网络(Deep neural networks,DNNs)依靠其良好的特征提取能力,在语音增强任务中得到了广泛应用。为进一步提高深度神经网络的语音增强效果,提出一种将深度神经网络和约束维纳滤波联合训练优化的新型网络结构。该网络首先对带噪语音幅度谱进行训练并分别得到纯净语音和噪声的幅度谱估计,然后利用语音和噪声的幅度谱估计计算得到一个约束维纳增益函数,最后利用约束维纳增益函数从带噪语音幅度谱中估计出增强语音幅度谱作为网络的训练输出。对不同信噪比下的20种噪声进行的仿真实验表明,无论噪声类型是否在网络的训练集中出现,本文方法都能够在有效去除噪声的同时保持较小的语音失真,增强效果明显优于DNN及NMF增强方法。  相似文献   

5.
针对传统单通道语音增强方法中用带噪语音相位代替纯净语音相位重建时域信号,使得语音主观感知质量改善受限的情况,提出了一种改进相位谱补偿的语音增强算法。该算法提出了基于每帧语音输入信噪比的Sigmoid型相位谱补偿函数,能够根据噪声的变化来灵活地对带噪语音的相位谱进行补偿;结合改进DD的先验信噪比估计与语音存在概率算法(SPP)来估计噪声功率谱;在维纳滤波中结合新的语音存在概率噪声功率谱估计与相位谱补偿来提高语音的增强效果。相比传统相位谱补偿(PSC)算法而言,改进算法可以有效抑制音频信号中的各类噪声,同时增强语音信号感知质量,提升语音的可懂度。  相似文献   

6.
为了有效克服传统谱减法引起语音畸变的问题,提出了相邻帧修正和增益平滑的改进谱减法.针对残余音乐噪声的产生,分析了传统谱减法的缺点以及音乐噪声形成的原因,利用对语音帧分解子帧和对增益函数递归平滑处理的方法,对传统谱减法进行了改进.最后对采集的带噪语音数据进行实验,将传统谱减法与改进后的谱减法做了对比和分析.实验结果表明,改进后的谱减法有效地降低了音乐噪声,提高了增强后语音的可懂度.  相似文献   

7.
针对传统谱减法存在的算法缺陷,提出一种基于联合最大后验概率的改进谱减法.传统谱减法通过获取带噪语音与噪声的幅度差值,并提取带噪语音的相位信息进行语音信号重建.该方法因为谱相减产生“音乐噪声”,并因为相位估计不准确,导致低信噪比下信号增强效果不理想.为此,引入多频带谱减法和相位估计,通过划分频谱,分别在子频带进行谱减法,有效降低“音乐噪声”的影响;同时构建基于最大后验概率的相位估计器,联合信号幅度函数和相位函数,通过多次交替迭代得到相位估值.实验结果表明,相对于传统谱减法,在低信噪比下该算法有效提高增强语音的质量感知和可懂度.  相似文献   

8.
针对谱减法在低信噪比下音乐噪声较大的缺点,通过分析人耳听觉掩蔽特性,提出一种改进的语音增强算法。在维纳滤波法的基础上结合掩蔽效应调整增益系数,采用非平稳环境下的最小约束递归平均算法进行噪声参数估计,利用最小均方误差准则的最优平滑因子对增强语音进行平滑处理,从而进一步消除音乐噪声。仿真结果表明,与改进谱减法与维纳滤波法相比,该算法在低信噪比情况下能有效抑制背景噪声和残余的音乐噪声,保持较好的语音质量和清晰度。  相似文献   

9.
为了减小传统谱减法引入的音乐噪声,提出了一种将多频带谱减和听觉掩蔽效应相结合的语音增强算法.用加权递归平滑的方法估计噪声的功率谱,对带噪的语音信号进行多频带谱减,计算听觉掩蔽阈值,再根据掩蔽阈值动态地调节谱减因子,通过增益函数得到增强后语音信号的频谱.仿真实验结果表明,与传统的谱减法相比,该算法在信噪比较低情况下,背景噪声和残余噪声得到了有效的抑制,语音信号的清晰度和可懂度也有了明显提升.  相似文献   

10.
针对带噪面罩语音识别率低的问题,结合语音增强算法,对面罩语音进行噪声抑制处理,提高信噪比,在语音增强中提出了一种改进的维纳滤波法,通过谱熵法检测有话帧和无话帧来更新噪声功率谱,同时引入参数控制增益函数;提取面罩语音信号的Mel频率倒谱系数(MFCC)作为特征参数;通过卷积神经网络(CNN)进行训练和识别,并在每个池化层后经局部响应归一化(LRN)进行优化.实验结果表明:该识别系统能够在很大程度上提高带噪面罩语音的识别率.  相似文献   

11.
本文介绍了一个拥有2000个说话者的面向移动电话应用的粤语语音数据库,该语音库用于电话应用方面的语音识别研究。在简单介绍本语音数据库的开发背景后,着重介绍了该语音库的结构、内容、特点和注释规范。  相似文献   

12.
介绍了Microsoft Speech SDK的功能以及相关的一系列API函数,分别利用其语音识别(Speech Recognition)引擎和语音合成(Textto Speech)引擎实现英文语音识别和中文文本语音合成功能,采用Access 2003数据库的查询操作完成翻译功能,进而实现整个英文到中文的学习系统,该系统具有很高的商业价值。  相似文献   

13.
戴礼荣  王子祥  王仁华 《计算机工程》2004,30(17):45-46,142
提出了汉语文语转换和语音编解码的基于DSP的实时综合处理的思想。介绍了实时综合处理的基于DSP的硬件与软件实现。文章介绍的基于DSP的实时综合处理具有以下几个方面的特点:(1)在单片DSF和不超过IMB的DSP最小系统上实现了一个任意文本的汉语文语转换系统;(2)为提高语音合成的自然度,提供了灵活的语音定制功能;(3)根据通信信道容最大小,实现可灵活选择的采甩语音合成方式的语音通信和语音编码方式的语音通信;(4)基于DSP的实时综合处理的在线重构;(5)基于RS232的通用异步串口的包括命令解释引擎、合成引擎、编码引擎等的模块化DSP软件结构。  相似文献   

14.
汉语语音拼接模块是TTS系统中最基本、最重要的模块。它的功能是根据文本分析、韵律生成的结果从语音数据库中提取语音基元,并将这些语音基元按照某种算法拼接在一起,从而实时地生成适当的语音输出文件。本文主要剖析了采用波形拼接的方法实现汉语语音拼接的技术,阐述了主要模块的开发过程。  相似文献   

15.
中等词汇的汉英语音翻译系统   总被引:1,自引:0,他引:1  
本文给出汉英语音翻译系统的组成,介绍了系统中连续汉语语音识别和汉英机器翻译的工作;我们已经在限定主题、中等词汇量的条件下实现了非特定人的连续语音识别,实现了汉英语音翻译实验演示系统。  相似文献   

16.
随着计算机技术、电子技术、多媒体技术以及人工智能的不断发展,语音技术作为一种新的信息传递媒介逐渐被计算机产品或其它的电子产品所使用,以用作新的人机接口:这种新的信息传递方式比传统的信息输入输出方式更加灵活、快捷和方便.因此语音编码取代字符编码成为信息的主要传递元素将成为信息技术发展的必然趋势。  相似文献   

17.
麦克风阵列语音增强技术及其应用   总被引:3,自引:5,他引:3  
洪鸥 《微计算机信息》2006,22(1):142-144
本文简要叙述了应用麦克风阵列进行语音增强的原理及方法。且由于麦克风阵列在实际语音处理时具有良好的拾取语音能力及噪声鲁棒性,本文将介绍该技术在车载系统环境、机器人语音识别、大型场所的记录会议、助听装置及声源定位等系统中的应用。  相似文献   

18.
一个面向语音识别的云南民族口音普通话语音数据库   总被引:2,自引:0,他引:2  
介绍了一个以语音识别为目的的云南民族口音普通话语音数据库。当前,语音识别技术要走向实用必须解决用户情况多样性带来的鲁棒性问题,通常把这个问题简要地归结为“男女老幼”和“南腔北调”。作为民族文化大省的云南,共有25个少数民族,广大少数民族同胞在说普通话时明显带有地方民族口音,云南民族口音普通话语音识别研究是用户情况多样性研究的重要内容,而为之建立云南民族口音普通话语音数据库是该研究的重要基础和先决条件。  相似文献   

19.
语音合成与语音识别提供了全新的人机交互方式,在信息处理、教育与商务应用等方面已显示出了巨大的优势。本文分析了MS Agent的工作原理,论述了基于MS Agent的语音系统的开发步骤,给出了系统运行示意图。  相似文献   

20.
基于COM技术的语音应用系统的设计和实现   总被引:3,自引:0,他引:3  
朱杰  张申生 《计算机工程》2001,27(11):143-144,F003
描述了将COM技术引用到语音应用系统的设计和实现中,提出利用COM技术定制语音应用系统的想法,并以Microsoft的SpeechSDK5.0为例,给出开发语音应用系统的主要设计思想、系统结构和实现方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号