首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
噪声评估在端点检测中的应用   总被引:1,自引:0,他引:1  
端点检测是语音识别中非常重要的部分,其准确性直接影响语音识别系统的识别率。传统端点检测方法预设经验门限对语音的短时特征进行判决,因为预设门限难以适应不同环境,其准确度和噪声鲁棒性较差。为了改善上述缺点,提出噪声评估的概念,对环境噪声的短时能量与短时过零率等短时特征进行分析,得到了更能表征环境噪声的门限。噪声评估结合传统的双门限法用于端点检测过程,解决了经验门限对不同环境适应性不强的问题。实验表明,噪声评估增加了端点检测的准确度和噪声鲁棒性。  相似文献   

2.
语音信号端点检测是语音信号的预处理,正确的语音信号端点检测结果直接影响语音识别等后续工作的运算量和准确率。本文介绍了时域方法中基于短时能量的语音信号端点检测方法,并用三种不同的短时能量计算方式和五种短时能量阈值进行了端点检测实验。  相似文献   

3.
本文在分析基于短时能量的语音端点检测算法局限的基础上,引入短时信噪比SNR估计方法,并设计自适应的判决门限,提出一种自适应语音端点检测算法.通过对平稳高斯白噪声环境下信噪比从-10dB到20dB的带噪语音信号进行的仿真实验表明,所提方法能更为准确地检测到语音的端点.  相似文献   

4.
端点检测是语音识别中的一项关键技术,端点检测的准确性对语音识别的性能有很大影响。本文将藏语语音学知识融入了端点检测过程中,同时综合时域频域特征,根据短时能频值和语音能量集中区的频域谱幅采取自适应门限方法,改进了端点检测的方法,实验表明该方法提高了端点检测的识别率,对于藏语语音识别起到了很好的辅助作用。  相似文献   

5.
端点检测作为语音信号处理系统前端处理的重要环节,直接影响系统处理的准确性和高效性.传统的端点检测在高信噪比和稳定噪声环境下取得了令人满意的效果,但在低信噪比和多变噪声环境下,检测的正确率会急剧下降.在分析研究典型的基于能量的端点检测算法的基础上,提出了一种子带短时能量与短时过零率结合的动态门限端点检测算法,有效克服了上述缺陷.多种信噪比条件下对不同噪声环境下的语音信号进行对比实验结果表明,所提方法较传统能量算法更为准确地检测到语音的端点.  相似文献   

6.
一种改进的检测语音端点的方法   总被引:8,自引:9,他引:8  
在语音识别系统中产生错误识别的原因之一是端点检测有误差。针对短时过零率对噪声的存在非常敏感,本文引入一种判决门限,修正了传统过零率的计算。同时引入窗长动态改变的端点检测方法,并将两者有机的融合到传统的双门限端点检测算法中。试验表明这种算法可以比较精确的检测出语音端点,适合于对端点检测比较敏感的语音识别算法。使用改进后的语音端点检测方法,可以有效地提高语音识别率。  相似文献   

7.
针对基于短时能量和短时过零率的语音端点检测算法不能自适应环境,在低信噪比时性能较差问题,提出了一种新算法。该算法利用最小短时能量评估环境噪声,优化参数提取算法,提高了参数本身的抗噪能力和自适应能力,再通过参数融合有效平衡了音节之间的差异,放大了语音与噪声之间的差异,最后通过一个动态检测门限,实现了不同信噪比下的端点检测。  相似文献   

8.
在语音识别技术的研究中,语音端点检测和拒识是语音前后端处理的关键技术。在噪声环境下,传统的过零率和短时能量的端点检测效果会变得很差;频域的端点检测方法虽然较时域的端点检测方法鲁棒性更高,但是它需要进行大量的计算不能很好地满足嵌入式系统。针对嵌入式系统的特点,为提高语音识别能力,提出了基于统计理论的孤立词的端点检测算法,在一个相对较长的时间段内语音信号服从正态分布,而噪音信号主要存在于信号均值的一定方差范围之内。方法既满足了嵌入式系统的计算要求,又有一定鲁棒性。  相似文献   

9.
语音信号处理中减谱法是一种传统的降噪方法,但减谱法利用固定的无音片段作为噪声样本容易产生误差。谱熵法是一种有效的端点检测方法,但在低信噪比环境下,检测效果将大大降低,并且门限估计也采用初始的固定无音片段。为此,提出了一种降噪和端点检测同步的方法。实验结果表明,該方法可以得到较高正确率的端点检测结果。  相似文献   

10.
鲁远耀  周妮  肖珂  叶青 《计算机应用》2014,34(5):1386-1390
为了提高强噪声环境下语音端点检测的正确率,克服传统的短时能量和短时过零率双门限语音端点检测算法在低信噪比(SNR)条件下检测性能急剧下降这一缺陷,提出了一种改进的语音端点检测算法。该方法对强噪声环境下的语音信号,首先进行小波阈值去噪,提高信噪比,再采用双门限法进行端点检测。实验结果表明,该算法具有一定的鲁棒性,在强噪声环境下仍能准确地进行语音端点检测,从而该算法的有效性得到验证。  相似文献   

11.
分析嵌入式语音识别系统设计的要点,提出了一种基于凌阳SPCE061A单片机的嵌入式特定人语音识别系统,重点讨论了嵌入式语音识别系统的相关算法及系统组成。该系统识别率高,价格低廉,可移植性好,已成功应用于智能机器人控制平台。  相似文献   

12.
基于ARM的嵌入式语音识别系统研究   总被引:1,自引:0,他引:1  
在分析语音识别原理的基础上,设计了一个基于ARM9和嵌入式Linux的嵌入式语音识别系统。采用动态时间归整(DTW)算法对语音信号进行特征参数序列比较并识别出结果。采用S3C2410微处理器和嵌入式Linux操作系统,将交叉编译后的语音识别C语言程序编译进嵌入式Linux操作系统的文件系统,实现语音识别系统的功能。  相似文献   

13.
针对语音识别系统对实时性和便携性的要求,提出一种基于MFCC/SVM在DM6446嵌入式系统开发平台上的实现方法,实现了一个面向非特定人的语音识别系统,将有向无环图多类分类支持向量机算法移植到该平台。并在该平台用DAG方法对非特定人孤立词和连接词进行语音识别,比隐马尔可夫模型有明显优势。通过样本预选取算法对训练样本进行预选取处理,并且应用到嵌入式语音识别系统中,大大降低了训练时间和测试时间。  相似文献   

14.
设计并实现了一种基于ARM9的嵌入式自动笛语识别系统.该系统由ARMS3C2410微处理器和UDA1341专用语音芯片为核心,配合其他功能电路,能实时自动识别汽车笛语.系统采用短时能量法,并引入动态能量阈值排除噪声.试验结果表明,该系统能够在不同的噪声环境下,准确地自动识别出各种不同车辆笛语的意义,能够满足实时系统的需...  相似文献   

15.
嵌入式语音识别系统的研究和实现   总被引:9,自引:1,他引:9  
本文首先给出了一种适合于在嵌入式平台上实现的可变命令集的非特定人语音识别系统,同传统的基于PC的非特定人语音识别系统相比,该系统具备内存消耗小,运算速度快的优点。然后给出了该语音识别系统在多种嵌入式平台上的实现和评估结果,论证了非特定人语音识别系统在嵌入式平台上实现的可行性及其对硬件的最低配置要求,在技术层次上分析了目前实现高性能语音识别SOC的主要问题和困难,并指出了今后相关的研究方向。  相似文献   

16.
Due to the increase in globalization, communication between different countries has become more and more frequent. Language barriers are the most important issues in communication. Machine translation is limited to texts, and cannot be an adequate substitute for oral communication. In this study, a speech recognition and translation system based on embedded technology was developed for the purpose of English speech recognition and translation. The system adopted the Hidden Markov Model (HMM) and Windows CE operating system. Experiments involving English speech recognition and EnglishChinese translation found that the accuracy of the system in identifying English speech was about 88%, and the accuracy rate of the system in translating English to Chinese was over 85%. The embedded technology-based English speech recognition and translation system demonstrated a level of high accuracy in speech identification and translation, demonstrating its value as a practical application. Therefore, it merits further research and development.  相似文献   

17.
随着移动设备的快速发展,使得语音识别系统大量地从实验室的PC平台转移到嵌入式设备中。将嵌入式语音识别与现有的嵌入式平台的各种应用软件相结合,能够使现有的各种应用软件(包括操作系统)增添便利的人机交互的语音界面。论文在基于Intel PXA270嵌入式微处理器开发平台上实现了WinCE操作系统的定制和移植;并结合WINCE5.0语音接口Speech Application Programming Interface(SAPI5.0),使用Embedded Visual C++4.0(EVC)成功开发嵌入式语音识别系统。  相似文献   

18.
随着移动设备的快速发展,使得语音识别系统大量地从实验室的PC平台转移到嵌入式设备中。将嵌入式语音识别与现有的嵌入式平台的各种应用软件相结合,能够使现有的各种应用软件(包括操作系统)增添便利的人机交互的语音界面。论文在基于Intel PXA270嵌入式微处理器开发平台上实现了WinCE操作系统的定制和移植:并结合WINCE5.0语音接口Speech Application Programming Interface(SAPI5.0),使用Embedded Visual C++4.0(EVC)成功开发嵌入式语音识别系统。  相似文献   

19.
针对语音识别系统对抗环境噪声的实际需求,提出一种二次组合抗噪技术,研究并设计了一种以数字信号处理器(DSP)为硬件平台,以隐马尔可夫模型(HMM)为算法的抗噪声嵌入式语音识别系统.DSP采用型号为TMS320VC5509A的芯片,配以外围硬件电路构成语音识别系统的硬件平台.软件设计以离散隐马尔可夫模型(DHMM)为识别算法进行编程,系统软件主要有识别、训练、学习和USB四个主要模块.实验结果表明:基于二次组合去噪技术的语音识别系统有更好的抗噪声效果.  相似文献   

20.
A novel approach for joint speaker identification and speech recognition is presented in this article. Unsupervised speaker tracking and automatic adaptation of the human-computer interface is achieved by the interaction of speaker identification, speech recognition and speaker adaptation for a limited number of recurring users. Together with a technique for efficient information retrieval a compact modeling of speech and speaker characteristics is presented. Applying speaker specific profiles allows speech recognition to take individual speech characteristics into consideration to achieve higher recognition rates. Speaker profiles are initialized and continuously adapted by a balanced strategy of short-term and long-term speaker adaptation combined with robust speaker identification. Different users can be tracked by the resulting self-learning speech controlled system. Only a very short enrollment of each speaker is required. Subsequent utterances are used for unsupervised adaptation resulting in continuously improved speech recognition rates. Additionally, the detection of unknown speakers is examined under the objective to avoid the requirement to train new speaker profiles explicitly. The speech controlled system presented here is suitable for in-car applications, e.g. speech controlled navigation, hands-free telephony or infotainment systems, on embedded devices. Results are presented for a subset of the SPEECON database. The results validate the benefit of the speaker adaptation scheme and the unified modeling in terms of speaker identification and speech recognition rates.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号