共查询到20条相似文献,搜索用时 93 毫秒
1.
2.
提出一种新的基于语音结构化模型的语音识别方法,并应用于非特定人数字语音识别.每一个数字语音计算倒谱特征之后提取语音中存在的对说话人差异具有不变性的结构化特征——全局声学结构(acoustical universal structure,AUS),并建立结构化模型,识别时提取测试语音的全局声学结构,然后与各数字语音的结构化模型进行匹配.测试了少量语料训练下的识别性能并与传统HMM (hidden Markov model)方法进行比较,结果表明该方法可以取得优于HMM的性能,语音结构化模型可以有效消除说话人之间的差异. 相似文献
3.
基于盲源分离的单通道语音信号增强 总被引:1,自引:0,他引:1
在运用基于独立分量分析(ICA)的盲源分离法进行语音增强时,要求观测信号(含噪语音)的个数不少于源信号(纯净语音和噪声)的个数.由于含噪语音通常是单通道的,所以必须合理地生成另一路的虚拟观测信号,以实现纯净语音和噪声的分离是个关键.介绍了一种基于盲源分离和谱减法的单通道语音信号增强的方法.首先运用谱减法对语音进行部分去噪,产生了ICA其中的一路观测信号,并产生了对噪声的估计值.用语音和噪声估计值的帧平均能量构成了加权函数,将噪声的估计值与原始含噪语音进行加权组合,生成另一路的虚拟观测信号.由于虚拟观测信号很好地再现了实际的观测信号,所以运用ICA可以较好地实现了噪声和语音的分离.同时,盲源分离和谱减法相互结合,使语音增强的性能提高.实验证明了算法可以在信噪比很小的情况下实现对噪声的去除,其效果要优于传统的去噪算法. 相似文献
4.
5.
6.
自适应语音识别算法仿真研究 总被引:2,自引:0,他引:2
研究语音识别准确性优化问题,针对目前由于不同说话人语音存在差异,实现语音词汇识别难,造成识别率较低等.为了解决上述问题,提出了一种新的自适应的短语音孤立词识别算法并加以实现.算法主要根据提取梅尔倒谱系数和动态时间弯折的模板匹配的优点,首先对输入语音信号进行端点检测,可以较好地对特定人的孤立词进行识别.同时算法给出了MFCC参数提取,对端点检测效果进行性能分析与评价.采用Matlab工具实现了语音识别系统,并设计了良好的人机交互界面,系统能够快速处理输入的语音,比较了不同人声音情况下的识别率.实验结果表明算法具有非常高准确的识别效果. 相似文献
7.
本文提出了一种单麦克风下的间接语音增强算法.该算法基于两个重要模块:第一个模块,采用基于均方协差预测的盲源提取算法将附加噪声从嘈杂的语音信号中提取出来.第二个模块,利用了一种基于语音和附加噪声协方差矩阵的广义子空间方法,提取纯净的语音信号.对该算法进行了白噪声环境和嘈杂火车等真实环境噪声下的仿真实验.实验结果表明,提出的算法有良好的语音增强效果,性能上与其他算法比较有明显的优势.将算法应用于噪声环境下的语音识别处理中,很大程度地降低了噪声对语音识别的影响,取得了良好的识别率. 相似文献
8.
说话人识别中MFCC参数提取的改进 总被引:1,自引:0,他引:1
在说话人识别方面,最常用到的语音特征就是梅尔倒频谱系数(MFCC)。提出了一种改进的提取MFCC参数的方法,对传统的提取MFCC过程中计算FFT这一步骤进行频谱重构,对频谱进行噪声补偿重建,使之具有很好的抗噪性,逼近纯净语音的频谱。实验表明基于此改进提取的MFCC参数,可以明显提高说话人识别系统的识别率,尤其在低信噪比的环境下,效果明显。 相似文献
9.
异源拼接是一种常见的数字语音篡改行为,其主要借助音频编辑软件将不同场景中录制的语音片段拼接在一起,以达到改变语音语义的目的。考虑到不同场景中所包含的背景噪声特性往往存在差异,提出了一种基于噪声一致性的数字语音异源拼接篡改检测算法。首先,采用时间递归平均(TRA)算法提取待检测语音中所含噪声;然后,通过突变点检测(CPD)算法检测噪声方差是否存在突变来判定待检测语音是否经过篡改,并对篡改位置作出定位。实验仿真结果表明,所提算法能对数字语音中的异源篡改位置进行有效检测。 相似文献
10.
语音增强的主要目标是从带噪语音信号中提取尽可能纯净的原始语音.文中介绍了一种基于自适应滤波进行语音增强的方法,这种方法比其他方法多用了1个参考噪声作为辅助输入,从而获得了比较全面的关于噪声的信息,因而能得到更好的降噪效果.通过计算机上的模拟处理,处理后的语音信号较原噪声语音信号显著地提高了信噪比,同时能有效地改善语音可懂度. 相似文献
11.
Automatic speech recognition (ASR) has made great strides with the development of digital signal processing hardware and software.
But despite of all these advances, machines can not match the performance of their human counterparts in terms of accuracy
and speed, especially in case of speaker independent speech recognition. So, today significant portion of speech recognition
research is focused on speaker independent speech recognition problem. Before recognition, speech processing has to be carried
out to get a feature vectors of the signal. So, front end analysis plays a important role. The reasons are its wide range
of applications, and limitations of available techniques of speech recognition. So, in this report we briefly discuss the
different aspects of front end analysis of speech recognition including sound characteristics, feature extraction techniques,
spectral representations of the speech signal etc. We have also discussed the various advantages and disadvantages of each
feature extraction technique, along with the suitability of each method to particular application. 相似文献
12.
13.
14.
基于DSP的回波抵消器的软件实现 总被引:1,自引:0,他引:1
随着通讯、数字信号处理和大规模集成电路技术的飞速发展,人们对语音通信质量的要求越来越高。回波抵消技术能有效的解决长距离电话网络、IP电话、免提电话和视频会议等通信系统中的回波问题,很好地改善了语音通信质量,具有广阔的市场前景。主要研究用于声音通讯系统中的声回波抵消技术。针对具体应用以及DSP芯片的特点,结合BEPNLMS算法,给出了一种基于TM S320VC 5402 DSP实现回波抵消的软件设计方案。 相似文献
15.
为了提高高校学生宿舍管理水平,设计和制作了准双工声控自动对讲机。该对讲机是以甲方为主的有线自动对讲机,它是采用数字声控的方法来切换对讲双方的讲话通道,从而实现自动对讲。它的声控部分采用单稳态延时及电子开关来实现,具有声控灵敏度调节,可以避免环境噪音干扰。它的讲话通道由前置放大器和功率放大器组成。即能满足声音信号的放大,又能使传声器和扬声器与功放得到合理的阻抗匹配,从而使对讲声音清晰宏亮。该机传呼距离远,音质清晰宏亮,成本低廉,具有较高的实用价值。 相似文献
16.
数字信号处理技术的迅速发展,为语音识别的实时实现提供了可能。采用TI公司的DSP芯片TMS320VC5409,建立一个汉语数字的语音实时识别系统。DSP的多通道缓冲串口与模数转换芯片的连接实现语音信号的采样;分别使用64k的程序和数据存储空间;系统的输出是使用TL16C550实现异步通信串口并使之与计算机RS232串口连接以观察识别结果。系统运行算法主要有字端点检测、特征提取和识别算法。实验结果表明,该系统基本能实现预期识别目标。 相似文献
17.
基于DSP的小型数字语音通信平台设计 总被引:4,自引:2,他引:2
为满足有效可靠的水声语音通信需求,针对语音信号和水下信道的特性,以TI公司的DSP芯片TMS320VC5416和DVSI公司的AMBE-2000芯片为基础,设计了一种适用于水下的小型数字语音通信系统方案,建立了通信系统的整体硬件结构,并对各关键功能模块进行了性能调试和分析;通过对系统的测试和性能分析,硬件系统运行稳定可靠,为实现水声语音通信搭建了良好的硬件平台。 相似文献
18.
于目标声源的方位信息与非线性时频掩蔽语音欠定盲分离方法和BP说话人识别技术的研究基础上,针对现实生活中多说话人交流场景,设计并提出了一种行之有效的解决方案,实现了对处于任意方位的任意目标说话人语音的提取.该方案总体上分目标语音搜索与提取两个阶段,搜索阶段采用了BP说话人识别技术,提取阶段采用了一种改进的势函数聚类声源方位信息与非线性时频掩蔽的语音欠定盲分离方法.实验结果表明:该方案具有可行性,可从混合语音流中有效提取处于任意方位的目标说话人语音,且效果较好,信噪比增益平均为8.68dB,相似系数为85%,识别率为61%,运行时间为20.6S. 相似文献
19.
张节 《数字社区&智能家居》2009,5(8):6280-6282
语音信号处理是一门多学科交叉的综合学科,它包含了语音学和数字信号处理等基础学科。这篇文章对语音信号作了两个方面的研究:语音信号的预处理和语音信号的特征提取。预处理是为了更好地进行语音信号的特征提取。是语音信号特征提取获得成功的重要保障。语音信号的预处理介绍了信号的主分量分析(PCA)技术和白化(whitening)技术.而语音信号的特征提取分为时域的和频域的特征提取。并用Madab编程实现了一段语音信号的分析处理。 相似文献