首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
给出一种采用LPCCEP特征参数和改进矢量量化的数字音说话人识别方法,该方法适于说话人集合适中(100人以内)情况,具有训练简单、存储数据量少、响应快等特点.为提高系统的识别率和可靠性,系统采用了方差修正的VQ改进算法,使建立的说话人模型考虑了说话人帧特征概率分布的更精细结构.实验结果表明,改进后的方法对提高系统的识别率效果明显。  相似文献   

2.
基于矢量量化改进算法的说话人识别   总被引:2,自引:0,他引:2  
给出一种采用LPCCEP特征参数和改进矢量量化的数字音说话人识别方法 ,该方法适于说话人集合适中(10 0人以内 )情况 ,具有训练简单、存储数据量少、响应快等特点 .为提高系统的识别率和可靠性 ,系统采用了方差修正的VQ改进算法 ,使建立的说话人模型考虑了说话人帧特征概率分布的更精细结构 .实验结果表明 ,改进后的方法对提高系统的识别率效果明显  相似文献   

3.
利用矢量量化的说话人识别系统的研究   总被引:2,自引:0,他引:2  
利用矢量量化(VQ)技术实现了与文本有关的说话人识别。系统采用语音信号的LPC倒谱系数、差值倒谱系数、基音周期和差值基音周期的混合特征参数作为识别的特征矢量集,对语音库中语音的平均识别率达到了92%,实时识别率达到90%以上。实验结果表明该系统具有识别精度高、速度快等特点,是一种有效的说话人自动识别的实现方法。  相似文献   

4.
矢量化(VQ)是一种及其重要的信号压缩方法,广泛应用于语音信号压缩等领域。说话人识别系统利用所建的VQ码本保存了说话人一定的声道特性,来进行说话人识别,完成这个识别系统有两个步骤:一是建立参考模型码本;二是进行模式匹配。  相似文献   

5.
在MATLAB环境下实现基于矢量量化的说话人识别系统.在实时录音的情况下,利用该识别系统,对不同人的1-7 s的语音进行辨识,准确率可达到98%.识别时间根据使用人数的不同,测试语音长度的不同辨识时间从1-20 s,实现与文本无关的自动说话人确认的实时识别.  相似文献   

6.
基于矢量量化方法的说话人识别技术   总被引:1,自引:0,他引:1  
说话人识别是一项通过语音来识别说话人身份的技术,它在保安、司法、军事、财经和信息服务等领域都具有广泛的应用前景。该文采用线性预测倒谱系数和美尔倒谱系数特征相结合,基于矢量量化聚类方法建立了一个与文本无关的、连续语音发音的说话人识别系统。只要矢量量化聚类法码本大小选择合适,该说话人识别系统就可以获得较好的识别效果。当阈值恰当选取时,该系统具备拒绝识别集外人的功能。  相似文献   

7.
针对双矢量量化方法中语音的静态特征和动态特征的权重不满足可加性的情况,提出了一种新的说话人识别方法——基于Sugeno测度的动态不可加双矢量量化说话人识别方法。该方法在Sugeno测度空间上将说话人语音的静态特征和动态特征用Sugeno测度进行动态融合。然后,在噪声环境下研究了该方法的识别效果,找到了噪声环境下语音的静态特征和动态特征参数的较优的权重组合。实验结果表明,与双矢量量化识别方法相比,该方法可以使识别率明显提高。该方法为研究各类语音特征参数之间的关系、探寻最优的特征匹配方案提供了一种新的途径。  相似文献   

8.
与语音处理的其他领域相比,自动语言辨识是一个相对较新的研究,而且是一项较难的课题。本文给出了语言辨识的两种矢量量化方法,并利用OGI-TS电话语音库对2种算法的性能进行了测试,然后给出了实验结果。2种算法的最佳识别率分别为65.38%和73.08%。  相似文献   

9.
通过分析当前话者识别系统中常用的一些特征,提出了新的特征向量组合。试验表明,特征组合后能很好地区分话者;在建模的过程中,提出了矢量量化模型与隐含马尔柯夫模型的混合识别策略,使正识率有所提高;同时,对文本有关和文本无关作了对比试验,试验证明,选择4~6个数字串的短语长度进行识别效果比较理想。  相似文献   

10.
介绍了基本矢量量化器的理论和结构设计基本原理.研究和实现了基本矢量量化器的LBG算法,并着眼于在优化系统结构和性能时选择LBG算法中产生初始码书的方法.通过对输入的语音信号进行矢量量化仿真,分析了基本矢量量化器的性能.  相似文献   

11.
提出一种基于线性预测系数多级矢量量化的数字零水印算法.通过对语音信号的线性预测系数进行多级矢量量化与待嵌入水印进行异或得到检测密钥,并在接收端进行盲水印提取.实验结果证明,该算法对于各种攻击尤其对幅度缩放、低通滤波和音量标准化具有较好的鲁棒性和不可见性.  相似文献   

12.
语音信号的MPLPC参数矢量量化   总被引:2,自引:0,他引:2  
介绍了多脉冲激励线性预测声码器的激励脉冲参数最大互相关函数搜索法.构造了线性预测参数及激励脉冲幅度参数矢量量化标法.实现了低码率语音压缩编码  相似文献   

13.
提出了一种基于奇异值分解和均值量化的音频数字水印算法。该算法首先把原始音频信号分段矩阵化,然后对每分段所对应的矩阵进行奇异值分解,选取其相应的奇异值,通过均值量化方法嵌入二值图像水印,实现了音频信号中水印的嵌入。仿真实验结果表明,该音频水印算法对噪声干扰、低通滤波和重新采样等信号处理具有更好的鲁棒性。  相似文献   

14.
在矢量量化孤立字识别系统中,对于识别字典中每一个单字,都要分别建立与这些单字对应的码本。本文提出一种按音节递归训练码本的算法,它的计算量是训练语音帧数的线性函数。而传统的LBG聚类算法的运算量则随训练矢量增加呈指数率增长。本文比较了这两种算法的失真特性,得出结论:新方法需要n+1次发音训练,就能达到全搜寻算法n次发音训练的失真性能。最后,本文给出矢量量化孤立字识别器的实验结果。  相似文献   

15.
提出一种新的、基于支持向量回归(SVR)的音频水印提取方法.在该方法中,利用子采样技术将原始音频信号划分为四个子音频信号.这些子音频对应的DCT系数间具有高的相关性,将这种相关性视为一种回归问题.在水印提取过程中,利用支持向量回归来学习这种相关性,并使用训练好的SVR完成水印的提取.实验结果表明该方法对比其它几种方法有良好的性能和更好的鲁棒性.  相似文献   

16.
研究了说话声音频数据的音频特征,并且利用SVM实现了说话声的实时检测.首先,对原始音频数据做预处理,然后对音频数据进行了3层小波分解,并提取了第3层低频系数的MFCC特征,同时提取了音频数据的质心、谱熵特征;其次,计算MFCC特征的均值、质心和谱熵的方差,由此构造了特征向量集;最后,利用SVM模型训练音频样本,并对测试集中的样本进行了测试和实时检测.实验表明,所提取的音频特征有效、合理,并且表现出良好的分类与检测性能.  相似文献   

17.
图像分割的基本原则与矢量量化的思想是一致的,因此,可以利用矢量量化的技术对图像进行分割.考虑到图像象素点的空间相关性,本文将原图像与它的平滑图像组合起来,形成一个二元组,称之为"广义图像”.采用矢量量化技术得到广义图像的局部最优分割,从而实现对原图的分割.实验结果表明该算法具有很强的噪声抑制能力,取得了令人满意的分割效果.  相似文献   

18.
在说话人识别中,美尔倒谱系数MFCC(Mel-Frequency Cepstral Coefficients)是一种常用的特征.但是这种通用的特征在耳语音的说话人识别上并不太理想.MFCC的三角滤波器组在Mel尺度上是均匀分布的,但是耳语音不同于正常音的发声,通过改变这种均匀分布的格局来改善耳语音说话人识别率,将全频域分成不同频段,分别调整各频段内滤波器的疏密程度,再将各频段的滤波器组合成新的滤波器组.修正后的滤波器模型在文本无关的耳语音说话人识别中相比原模型识别效果有所提高.  相似文献   

19.
通过对四声调在基音图形上反映出的特征所作的分析,提出了一种合理地构成四声调特征矢量的方法,使VQ在识别四声问题的应用方案得到简化。综合两种判决方法各自的特点而设计的联合判决方案,有效地消除了大部分的误识现象。实验结果表明,基于上述方案的系统对1075个不同字的四声调的识别率达到99%以上。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号