共查询到19条相似文献,搜索用时 62 毫秒
1.
2.
3.
彭靓 《计算机光盘软件与应用》2012,(24):110+127
随着计算机技术的不断发展和信息技术的不断进步,各类智能机器也逐步进入到人们的生活中.语音识别是一种前景广阔、社会效益广泛、经济效益明显的技术,在快速发展的同时也不可避免地产生了一些问题.本文主要针对基于HMM和神经网络的语音识别系统进行了细致的分析,期待能对我国语音识别系统的研究和实践提供有效的借鉴和参考. 相似文献
4.
针对音、视频双模态语音识别能有效地提高噪声环境下的识别率的特性,本文设计了车载语音控制指令识别实验系统。该系统模拟车载环境,把说话时的视频信息融入到语音识别系统中,系统分为模型训练、离线识别和在线识别3部分。在线识别全程采用语音作为人机交互手段,并具备用户自适应的功能。离线识别部分将系统产生的数据分层次进行统计,非常适合进行双模态语音识别算法研究。 相似文献
5.
一种基于改进CP网络与HMM相结合的混合音素识别方法 总被引:2,自引:0,他引:2
提出了一种基于改进对偶传播(CP)神经网络与隐驰尔可夫模型(HMM)相结合的混合音素识别方法.这一方法的特点是用一个具有有指导学习矢量量化(LVQ)和动态节点分配等特性的改进的CP网络生成离散HMM音素识别系统中的码书。因此,用这一方法构造的混合音素识别系统中的码书实际上是一个由有指导LVQ算法训练的具有很强分类能力的高性能分类器,这就意味着在用HMM对语音信号进行建模之前,由码书产生的观测序列中 相似文献
6.
为了解决语音信号中帧与帧之间的重叠,提高语音信号的自适应能力,本文提出基于隐马尔可夫(HMM)与遗传算法神经网络改进的语音识别系统.该改进方法主要利用小波神经网络对Mel频率倒谱系数(MFCC)进行训练,然后利用HMM对语音信号进行时序建模,计算出语音对HMM的输出概率的评分,结果作为遗传神经网络的输入,即得语音的分类识别信息.实验结果表明,改进的语音识别系统比单纯的HMM有更好的噪声鲁棒性,提高了语音识别系统的性能. 相似文献
7.
研究了利用隐马尔可夫模型(HMM)对动态语音模式进行时间归一化的方法。引入了借助于HMM对语音基元观测序列所做的一种分段,这种分段被称之为语音基元观测序列的HMM全状态分段,并且定义了HMM全状态分段的符合度。根据HMM全状态分段的符合度确定了语音基元观测序列的最优HMM全状态分段,通过最优HMM全状态分段把语音基元观测序列转换为固定维数的向量,从而实现了动态语音模式的时间归一化。将动态语音模式的这一时间归一化方法在结合HMM和人工神经网络(ANN)的混合语音识别方法中进行了应用,实验结果表明这一时间归一化方法的有效性。 相似文献
8.
9.
姜天辰 《计算机工程与应用》1998,34(5):24-25
本文讨论了用矢量量化/隐马尔可夫模型(VQ/HMM)法实现的语音识别系统,重点阐述了如何利用HMM对多训练序列的迭代公式使系统具有自学习功能。经实测证明,该系统基本达到了预期性能。 相似文献
10.
基于HMM建模技术的语音识别改进算法 总被引:1,自引:0,他引:1
本文在隐马尔可夫模型(Hidden Markov Model,简称HMM)的基础上,提出了一种帧相关模型的改进算法,它与现行HMM方法中的前后帧相关模型比,算法简化,计算量明显减小,与传统HMM方法比,提高了识别率 相似文献
11.
12.
MATLAB环境下的基于HMM模型的语音识别系统 总被引:5,自引:0,他引:5
在MATLAB环境下利用语音工具箱Voice Box实现基于连续概率密度隐含马尔科夫模型的汉语语音识别系统。在实时录音的情况下,利用该语音识别系统,不同的人对20条2~8个字的语音命令进行识别,准确率可达到95%,识别时间1.5~3s,实现了小词汇量连续语音的非特定人的实时识别。 相似文献
13.
一种改进的隐马尔可夫模型在语音识别中的应用 总被引:1,自引:0,他引:1
提出了一种新的马尔可夫模型——异步隐马尔可夫模型.该模型针对噪音环境下语音识别过程中出现丢失帧的情况,通过增加新的隐藏时间标示变量Ck,估计出实际观察值对应的状态序列,实现对不规则或者不完整采样数据的建模.详细介绍了适合异步HMM的前后向算法以及用于训练的EM算法,并且对转移矩阵的计算进行了优化.最后通过实验仿真,分别使用经典HMM和异步HMM对相同的随机抽取帧的语音数据进行识别,识别结果显示在抽取帧相同情况下异步HMM比经典HMM的识别错误率低. 相似文献
14.
15.
16.
音乐识别的研究早在20世纪70年代就开始了,但直到最近,识别系统的性能仍不令人满意。该文提出了利用HMM进行音乐识别的新思路。给出了基本的算法框架,并对相关的问题进行了讨论。 相似文献
17.
18.
19.
This article presents a cross-lingual study for Hungarian and Finnish about the segmentation of continuous speech on word
and phrasal level by examination of supra-segmental parameters. A word level segmentationer has been developed which can indicate
the word boundaries with acceptable precision for both languages. The ultimate aim is to increase the robustness of speech
recognition on the language modelling level by the detection of word and phrase boundaries, and thus we can significantly
decrease the searching space during the decoding process. Searching space reduction is highly important in the case of agglutinative
languages.
In Hungarian and in Finnish, if stress is present, this is always on the first syllable of the word stressed. Thus if stressed
syllables can be detected, these must be at the beginning of the word. We have developed different algorithms based either
on a rule-based or a data-driven approach. The rule-based algorithms and HMM-based methods are compared. The best results
were obtained by data-driven algorithms using the time series of fundamental frequency and energy together. Syllable length
was found to be much less effective, hence was discarded. By use of supra-segmental features, word boundaries can be marked
with high accuracy, even if we are unable to find all of them. The method we evaluated is easily adaptable to other fixed-stress
languages. To investigate this we adapted our data-driven method to the Finnish language and obtained similar results. 相似文献