首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
为充分利用含噪语音特征来提升深度神经网络的语音增强性能,提出一种融合时频域特征的语音增强方法。以含噪语音的波形和纯净语音的对数功率谱分别作为训练特征和训练目标,获取含噪语音时域特征到纯净语音频域特征的映射关系。将含噪语音的波形和对数功率谱共同作为训练特征,构建融合含噪语音时域和频域特征的深度神经网络实现语音增强。实验结果表明,与单纯使用频域特征的语音增强方法相比,该方法能够明显提升增强语音的质量和可懂度,具有更好的语音增强性能。  相似文献   

2.
从人类语音产生的机理出发,介绍了语音信号的特征和语音信号的语谱图,引出了语音信号的产生模型.同时讨论了在语音信号产生的模型应用中,线性预测编码方法及语音产生模型在语音合成和语音识别中的应用原理,体现了语音产生模型在语音处理技术方面的重要地位.  相似文献   

3.
介绍一种基于单片机STC89C52RC、语音芯片ISD1730组成的多段语音录放系统设计方案。描述了语音电路设计、语音分段录入、语音段定位、语音段剪辑、多段语音组合输出等的实现方法;并制作了一个具有语音输出功能的温度测量仪。实验表明,具有语音输出功能的温度测量仪器更便于操作和使用。  相似文献   

4.
基于MP算法的语音信号稀疏分解   总被引:4,自引:1,他引:3       下载免费PDF全文
语音信号稀疏分解是一种新的语音信号分解方法,可以将语音信号分解为很简洁的近似表达形式。在语音信号稀疏分解的基础上,可应用于语音处理的多个方面,如语音压缩、语音去噪和语音识别等。研究利用Matching Pursuit(MP)算法实现语音信号的稀疏分解,实验结果表明基于MP算法的语音信号稀疏分解具有较好的重建精度和较高的稀疏度。  相似文献   

5.
频谱分析技术在语音信号处理中得到了广泛应用。短时频谱分析是各种语音频域处理方法的基础,广泛应用于语音编解码、语音合成、语音识别等领域。通过时频分析理论,对语音短时频谱分析与合成进行理论推导,表明语音短时频谱分析与合成可以通过加窗和滤波语音信号实现,并据此提出具体算法,按照该算法处理实际语音数据。合成语音与原始语音相比,差异很小。  相似文献   

6.
在语音技术的发展过程中使用了大量的语音信号特征参数,好的语音信号特征参数能对语音识别起至关重要的作用。本文对语音信号特征参数、语音信号特征参数的选择进行了介绍,并介绍了语音信号的短时能量、短时平均幅度的提取。  相似文献   

7.
语音信号特征参数研究   总被引:1,自引:0,他引:1  
在语音技术的发展过程中使用了大量的语音信号特征参数,好的语音信号特征参数能对语音识别起至关重要的作用。本文对语音信号特征参数、语音信号特征参数的选择进行了介绍,并介绍了语音信号的短时能量、短时平均幅度的提取。  相似文献   

8.
在特定人语音识别系统中,噪声严重影响语音特征提取,并导致语音识别率明显下降。针对在噪声环境下语音识别率偏低的问题,通过谱减法去除语音信号噪声,并根据语音信号语谱图可视化的特点,运用脉冲耦合神经网络从语音信号的语谱图中提取熵序列作为特征参数进行语音识别。实验结果表明,该方法能较好地去除语音信号中的噪声,并能使在噪声环境下的特定人语音识别系统具有较好的识别效果。  相似文献   

9.
语音增强方法综述   总被引:3,自引:0,他引:3  
环境噪声会影响语音质量,严重的情况下语音将完全淹没到噪声中,无法分辨.语音增强就是从带噪语音信号中提取尽可能纯净的原始语音.本文对目前一些主要的语音增强方法做了研究,分析了各种方法的优缺点.在实际应用时,要根据具体的噪声情况和特定环境,选用不同的语音增强方法或语音增强方法的组合,来达到最好的语音增强的效果.  相似文献   

10.
语音静噪是以语音检测为基础实现无语音时屏蔽系统输出的一项功能.由于短波电台接收机存在诸多噪声干扰,致使语音静噪较难实现.本文设计实现一种以TMS320F2812 DSP芯片为核心的语音检测系统,对短波电台接收到的信号进行分析和处理,并应用短时自相关算法进行语音检测.如果检测存在语音信号则通过DA把语音转换输出.通过在实际应用环境中测试表明该语音检测系统结构简单,语音检测准确度高,可以有效解决短波电台的语音静噪问题.  相似文献   

11.
对各种语言发音模型进行了综述,分别讨论了言语声音模型和言语动作模型。言语声音模型研究语言发音的声学原理,利用声音信号处理技术重构语音信号波形,由于对声源和共鸣之间的关系的认识不同,以及对共鸣的分析方法的不同,产生了3种不同的语言发音模型,第一种是频谱分析模型,第二种是共振峰模型,第三种是生理发音模型。言语动作模型研究发音器官的运动过程,利用图像信号处理技术重构发音器官的发音动作,根据建模方法的不同,言语动作模型可以分为3类:生理机能模型、几何特征模型、统计参数模型。  相似文献   

12.
一种改进的线性预测语音编码技术及实现   总被引:2,自引:1,他引:1       下载免费PDF全文
线性预测编码是实现语音编码的一项重要技术,介绍了线性预测编码技术的实现,提出一种改进型的声激励线性预测语音编码方法。最后,将简单LPC语音编码与声激励LPC语音编码进行比较。实验结果表明,该方法能够很好地实现语音编码,声音效果也比简单LPC更理想。  相似文献   

13.
本文介绍了一种基于并行处理的语音生成工具之设计实现,该工具可用来支持多媒体技术,各种有声软件,以及语音库的运行,其工作环境为IBM-PC系列微型计算机及其兼容机。  相似文献   

14.
简要地介绍了用于语音分析合成的时城基音同步叠加算法,在此基础上提出一种汉语语音时域声调转换方法。利用这种方法可以将一种声调的语音转换为另一种声调的语音,除微小的音质降低外,仍可保持较好的语音质量。这种方法直接对语音波形进行处理,具有计算简单、能在一般微型计算机上进行实时的特点。将之用于语音合成系统,可以通过相同声韵母的音节只存储一种声调的语音数据而大大降低音库的容量;用这种方法按照汉语语句的语调变化规律来合成语句,还可以较好地改善汉语语句合成的自然度.  相似文献   

15.
在纯净语音条件下,提出了一种基于短时傅里叶变换的敏感语音提取,该提取利用3种FIR数字滤波器对纯净语音在不同频率范围的特征语音进行选取,从而产生不同的音效.待处理的声音文件可以是自己录制的一段语音,也可以是任意格式的音频文件,通过DSP和编译软件实现敏感语音提取,并在数字处理芯片TMS320C5402上实现.  相似文献   

16.
范炳远  方建安 《计算机工程》2008,34(15):274-276
分析语音信号声道特征参数提取问题,针对自相关法的缺陷,提出声道特征参数提取的改进算法。介绍其运算步骤和流程,考虑FPGA适于短期开发及高速性的优点,设计Finite State Machine来控制复杂运算操作及对寄存器的频繁访问。利用Cyclone EP1C6 FPGA实现语音信号声道特征参数提取算法。  相似文献   

17.
Robust Environmental Sound Recognition for Home Automation   总被引:1,自引:0,他引:1  
This work presents a robust environmental sound recognition system for home automation. Specific home automation services can be activated based on identified sound classes. Additionally, when the sound category is human speech, such speech can be recognized for detecting human intentions as in conventional research on home automation. To attain this ambitious goal, this study uses two key techniques: signal-to-noise ratio-aware subspace-based signal enhancement and sound recognition with independent component analysis mel-frequency cepstral coefficients and a frame-based multiclass support vector machines, respectively. Simulations and an experiment in a real-world environment are given to illustrate the performance of the proposed robust sound recognition system.  相似文献   

18.
Artificial talkers and speech synthesis systems have long been used as a means of understanding both speech production and speech perception. The development of an airway modulation model is described that simulates the time-varying changes of the glottis and vocal tract, as well as acoustic wave propagation, during speech production. The result is a type of artificial talker that can be used to study various aspects of how sound is generated by humans and how that sound is perceived by a listener. The primary components of the model are introduced and simulation of words and phrases are demonstrated.  相似文献   

19.
视频数据中的音频流包含了丰富的语义信息.在基于内容的视频检索中,对音频信息的分析是不可分割的一部分.本文主要讨论基于内容的音频场景分割,分析各种音频特征及提取方法,并在此基础上提出一种新的音频流分割方法,根据六种音频类型(语音、音乐、静音、环境音、纯语音、音乐背景下的语音和环境音背景下的语音)的音频特征对视频数据中的音频流分割音频场景.实验证明该方法是有效的,在保证一定的分割精度的同时,准确率和查全率都得到了较大的提高.  相似文献   

20.
于目标声源的方位信息与非线性时频掩蔽语音欠定盲分离方法和BP说话人识别技术的研究基础上,针对现实生活中多说话人交流场景,设计并提出了一种行之有效的解决方案,实现了对处于任意方位的任意目标说话人语音的提取.该方案总体上分目标语音搜索与提取两个阶段,搜索阶段采用了BP说话人识别技术,提取阶段采用了一种改进的势函数聚类声源方位信息与非线性时频掩蔽的语音欠定盲分离方法.实验结果表明:该方案具有可行性,可从混合语音流中有效提取处于任意方位的目标说话人语音,且效果较好,信噪比增益平均为8.68dB,相似系数为85%,识别率为61%,运行时间为20.6S.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号