首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 156 毫秒
1.
为克服低速率声码器因清浊音硬判决、粗判决而导致解码语音有帧过渡等不自然感的缺陷,在分析比较目前主流声码器编码算法中激励参数提取和量化算法的基础上,将模糊数学中的隶属度概念引入语音子带清浊音描述。提出了五维的浊音隶属度矢量概念,用于精细描述语音丰富的激励信息;阐述了浊音隶属度矢量的提取算法;提出了矢量量化码本的模糊聚类与LBG级联训练算法(F-LBG:Fuzzy-LBG);采用提取算法提取、建立了浊音隶属度码本的训练样本集,采用F-LBG训练了浊音隶属度码本;将提取算法和F-LBG法训练得到的浊音隶属度码本分别应用于正弦激励声码器、混合激励声码器和同态声码器的语音编、解码仿真。结果表明,用浊音隶属度矢量描述合成语音激励信号的算法,具有较高的准确性和较强的噪声鲁棒性。  相似文献   

2.
为了对语音帧的清浊音属性进行判断,本文提出了一种基于快速样本熵的清浊音判决和语音分割方法。通过计算英语单音素发音的样本熵,可以发现清浊音的信号复杂度有明显的区别,并根据复杂度的不同来进行清浊音的判决。同时,在快速算法中将数值二值化,由低维信号矢量的近邻矩阵递推高维信号矢量的近邻矩阵,可以快速有效的进行语音分割,并进行仿真实验。仿真结果表明,与其他传统方法相比,基于样本熵的方法可以得到较好的语音分割结果,而且快速样本熵算法将运算时间缩短了80倍,明显减少了运算时间,提高了运算效率。该研究在语音信号方面具有较好的应用前景。  相似文献   

3.
基于分带谱熵和小波域Teager能量提出了一种改进的语音清浊分类算法.该算法首先计算频域内的分带谱熵,然后在小波域计算不同频带的Teager能量,计算出低频能量所占的比例,通过这2个参数进行清浊判断.实验结果证明,由于分带谱熵能加深清浊音之间的差异,Teager能量能快速跟踪声门周期内信号能量的变化,因此该算法更容易提取浊音,在纯净语音和含噪语音上的性能都优于幅度能量算法.  相似文献   

4.
评价一个参数对于划分语音信号成清浊音段的有效性是十分困难的问腰.为解决此问题,提出了一种基于粒计算的语音信号清浊音检测算法.该算法利用粒的理论对清浊音检测中用到的8种语音信号的特征参数进行分析,构造决策表,计算得出各参数对清浊音判决的重要度.最终选用参数组合MFCC(Mel.Frequence Ceptral Coefficients)、小波互相关、小波系数和短时自相关进行语音实时分段,得到多参数结合的求解最优路径.进一步提取决策规则并进行多参数清浊音分段,试验表明获得了好的效果:对于纯净语音分段算法的准确率达到平均93.86%,对于带噪语音准确率达到平均90.27%.此外算法的处理帧长仅为20样点,意味着有很好的实时性.  相似文献   

5.
针对语音中清音和浊音特性的不同,本文提出了一种新的清浊音判别方法,利用K奇异值分解(K singular value decomposition,KSVD),分别对数据样本中的清音和浊音进行字典学习,训练出符合样本信号特性的浊音字典和清音字典,将多个单清音字典组合成组合清音字典,多个单浊音字典组合成组合浊音字典,并将待测信号在组合浊音字典和组合清音字典上进行稀疏表示,通过对比其系数的稀疏性来判别清浊音。研究结果表明,在相同条件下,与传统的清浊音判别方法相比,基于组合字典的判别方法对于多音素的清浊音判决具有更加准确的判决结果。该研究对语音识别和语音编码具有重要作用。  相似文献   

6.
一种低速率多模MBE线性预测语音编解码器   总被引:2,自引:0,他引:2  
提出了一种多模多带激励(MBE)线性预测语音编解码器,与MBE编解码器相比在两个方面有所改进:一是在频谱幅度估计中结合了线性预测的方法,幅度的线性预测结果用线谱频率(LSF)来表示并量化,解决了原系统频谱幅度量化中维数变化的问题; 二是在清/浊音判决中,固定每帧中子带的个数,划分不同的清/浊音判决模式,在各种清/浊音判决模式下,根据LSF不同的统计特性,用不同的码本对LSF矢量进行量化,提高了量化的质量.仿真结果显示,合成语音可懂度高,时域语音波形图及语谱图都拟合较好.  相似文献   

7.
针对在基于谐波模型的相位谱语音增强算法中,只对浊音段相位进行重构导致语音失真和听觉不连贯的问题,提出了用信噪比信息与时频特征改进相位重构的新方法。首先,引入与相位失真有关的时频特征并计算决策阈值;然后利用信噪比信息计算带噪语音与纯净语音的相位偏差,两项比较进一步估计清音段与浊音段的语音相位,能有效改善语音的连贯性;最后将重构的相位与改进二元假设模型的幅值估计结合并进行语音增强。经过对不同噪声背景下的不同语音进行实验表明:新算法的相位差更接近于原信号。与对比算法相比,增强语音的信噪比平均提高2.39dB,语音感知评价指标平均提高0.12,有效地降低了语音失真,提高了语音可懂度。  相似文献   

8.
小波去噪在语音识别中的应用   总被引:7,自引:1,他引:6  
将小波应用于语音识别的预处理中,对带噪语音信号在小波域内区分语音的清,浊音,分别用门限进行不同的处理,将去噪后的小波系数反变换后再进行语音识别。实验结果表明,小波去噪对在噪声环境下的语音识别性能有很大的改进。  相似文献   

9.
自相关基音周期检测是语音信号处理的关键技术,除了保证信号处理的质量外还要注重算法的效率.通过短时自相关函数得到浊音语音的基音周期,在自相关运算过程中采用极性相关法和峰值估算法以提高运算效率.  相似文献   

10.
为满足恶劣无线环境下低速率语音通信需要,针对混合激励线性预测(MELP)提出了一种基于信道软译码的差错隐藏算法。利用软译码所得对数似然概率比估计比特错误概率,提出了利用比特错误概率和信源残留冗余,基于最大后验概率(MAP)估计合成端语音清浊音模式。对不同的清浊音模式,选择不同的参数重构方案,浊音帧时,利用对数似然概率比基于最小均方误差(MMSE)准则进行参数重构;清音帧时,硬判决对数似然概率比,由硬判决结果通过映射直接重构参数,在信道编码为递归系统卷积码和并行级联卷积码情况下,采用PESQ测试了提出的差错隐藏算法误码条件下合成语音质量。测试结果表明,与近年来提出的针对MELP的差错隐藏算法相比,该算法具有更好的性能。  相似文献   

11.
针对语音信号在离散余弦变换基上的稀疏性,提出了一种基于压缩感知的语音压缩编码算法。算法在编码端采用随机高斯矩阵直接对语音波形进行观测,并采样均匀量化技术对随机观测进行量化。解码端利用未饱和的观测值通过Lasso算法实现语音信号的重构。仿真结果表明,该算法具有良好的重构性能。  相似文献   

12.
G.729算法是一种高性能的语音压缩算法,但较高的算法复杂度限制了它的应用.该文以Android点对点实时语音通信为例,研究了G.729优化算法,并且在Android平台上实现了该优化算法.测试结果证明,优化后的G.729算法,大大降低了语音处理的时间,满足点对点实时语音通信的需求.  相似文献   

13.
针对冲击噪声环境下的语音增强问题提出了一种不依赖任何语音信号模型、适用于冲击噪声的基于信号子空间分解的多通道语音增强算法。该算法把阵列信号处理中的协变异应用到语音增强中,对带噪语音信号的协变异系数矩阵进行特征值分解得到纯净语音信号的子空间。仿真实验结果表明:该算法对于冲击噪声有抑制作用,对高斯白噪声、高斯有色噪声也有一定的抑制效果。  相似文献   

14.
针对语音识别过程中环境噪声干扰大的问题,提出一种基于经验模态分解(EMD)与动态时间规整 (DTW)相结合的孤立词识别算法。该方法利用EMD 算法,首先将提取的性能不好的语音信号分解成若干个基本模函数(IMF),去掉原始信号中的干扰和噪声。然后,基于DTW 算法,采用短时过零率和短时能量对语音信号进行端点检测,提取语音特征参数后与参考模板进行匹配。将参考模板与待测模板之间的最短路径作为识别结果。仿真结果表明,该算法能够提高语音的识别效率和识别的正确率。  相似文献   

15.
智能语音识别技术的研究已有较长的时间,但由于语音信号本身所具有的多变性、瞬时性、连续性和动态性的特征,使得机器在不同的环境尤其是噪声环境中进行语音信号的识别仍具有一定的困难.为了提高带噪语音信号识别的准确率,本文研究了一种常用的噪声估计算法,即基于后验信噪比的时间递归平均算法.并在此算法的基础上提出了一种对平滑因子的改进算法,将语音活性检测算法与这两种算法在不同输入信噪比下进行模拟验证.通过运算结果的对比分析可以看出,改进后的算法相比于语音活性检测算法最高可以使输出分段SNR提高2.1 dB,相比于原时间递归平均算法最高可以使输出分段SNR提高0.5 dB,表明低输入SNR下改进后的算法可以有效提高语音信号的质量和可懂度.  相似文献   

16.
提出了一种基于ICA变换和MAP估计的单通道语音增强算法,该方法依据ICA变换后语音信号服从拉普拉斯分布的特点,运用MAP估计纯音信号,然后进行逆ICA变换,获得时域纯音信号。仿真分析表明:在输入信噪比较低情况下,该算法增强效果好,同时增强后的语音信号失真小。  相似文献   

17.
为了将低比特率语音编码算法应用于实际的语音处理系统,开发了一种基于TMS320VC5410定点DSP 的实时低速率语音压缩系统.语音编码方法采用一种高质量的4 kb/s散布脉冲CELP算法.用汇编语言编写的定点DSP程序能在目标平台上实时完成语音数据的采集、处理和回放功能.整个系统大约占用31 K存储空间, 算法复杂度达到指令数为5.42×107条/s.客观质量测试结果显示,DSP定点程序处理后的语音质量非常接近于浮点C语言处理后的结果,表明该语音处理系统能满足实时语音压缩的需求.  相似文献   

18.
提出了一种二级搜索模型,该模型首先利用最小音节步长搜索算法进行语音段检测,然后采用二分搜索算法确定语音段的精确位置。理论分析及实际运行结果表明,与传统的基于能量的端点检测算法相比,其搜索效率能够提高70%以上。该算法对语音环境有较高的要求,可用于有声出版物语音自动分割,以及具有良好信噪比系统的语音端点检测。  相似文献   

19.
微型麦克风阵语音增强在基于微型设备的语音通信及语音识别中具有重要的应用价值.通过引进多路抗串扰自适应信号抵消(MCRASC)技术,对子带修正广义旁瓣抵消(MGSC)方法提供更为有效的信号阻塞方式,为微型阵列语音增强提出了一种更为可行的算法.理论分析和真实环境下的实验结果验证了所提算法的有效性和优越性.实验中,所提算法比子带MGSC算法所获增强语音的信噪比提高了12.5dB.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号