期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

《信息与电脑》2018,(5)

在与文本有关的说话人识别系统中,既需要识别说话人的身份,又需要识别语音文本的内容。语音信号特征参数的选取对系统来说至关重要。目前,在传统语音识别系统的研究中,主要采用MFCC参数作为特征参数进行识别。笔者对语音信号特征参数进行分析,对不同的语音特征参数组合进行实验。实验结果证明,在该系统中,MFCC参数与基音参数的组合提高了系统的识别率。相似文献

2.

小波包变换与Teager能量算子结合的说话人识别

下载免费PDF全文

祝鹏王成儒《计算机工程与应用》2013,49(9):187-189

在说话人识别系统中,语音特征参数的提取是影响系统性能的关键因素之一。在研究了MFCC参数的基础上,结合MFCC参数在信号的低频部分具有高频率分辨率以及小波包变换可以对信号的高频部分进行分解以提高高频部分的频率分辨率的优点,将二者结合,将Teager能量算子引入到信号高频部分的能量参数求解,构造了一种新的混合特征参数,采用支持向量机实现说话人的分类识别。实验结果表明,该特征参数有效提高了说话人辨识系统的识别率。相似文献

3.

主成分分析和K-means聚类在说话人识别中的应用

马金龙景新幸杨海燕冼灿娇赵靖《计算机应用》2015,(Z1)

为了解决特征提取计算量大且特征参数不够全面的问题,提出了用主成分分析和K-means聚类进行语音特征参数提取的方法。通过对说话人识别系统中最常用的线性预测倒谱系数( LPCC)参数和梅尔倒谱系数( MFCC)参数提取原理以及差分参数的提取算法深入研究,选择LPCC、MFCC以及其一阶差分参数的组合作为最终混合特征参数。首先用主成分分析降低每一帧语音信号特征参数的阶数,然后经过K-means聚类降低帧数,最后通过矢量量化( VQ)来进行说话人识别。实验结果表明,该方法降低了计算复杂度,同时也提升了识别准确性。相似文献

4.

利用语音非线性特征改进说话人识别的性能

侯丽敏邓德春王朔中《模式识别与人工智能》2006,19(6)

分析说话人发音过程中的非线性现象,通过计算38个汉语音素的最大Lyapunov指数验证语音内含混沌性.从不同侧面讨论语音非线性特征量的物理意义和计算方法,包括Lyapunov指数、二阶熵和相关维数,并将这些非线性特征用于说话人识别.在Gauss混合模型的说话人识别系统中,基于MFCC参数得到识别结果的基础上,用最大Lyapunov指数、二阶熵和相关维数再进行说话人的二次辨认,提高说话人识别的性能.实验结果表明非线性特征参数中包含有说话人特征的信息,因此可用于改进基于MFCC的识别性能. 相似文献

5.

基于时频分布与MFCC的说话人识别

金银燕于凤芹何艳《计算机系统应用》2012,21(4):189-192,178

针对MFCC不能得到高效的说话人识别性能的问题,提出了将时频特征与MFCC相结合的说话人特征提取方法。首先得到语音信号的时频分布,然后将时频域转换到频域再提取MFCC+MFCC作为特征参数,最后通过支持向量机来进行说话人识别研究。仿真实验比较了MFCC、MFCC+MFCC分别作为特征参数时语音信号与各种时频分布的识别性能,结果表明基于CWD分布的MFCC和MFCC的识别率可提高到95.7%。相似文献

6.

新颖检测法在说话人识别技术中的应用

石艳王晓晔《现代计算机》2008,(7)

提出一种用于说话人识别中说话人语音特征向量聚类的方法--新颖检测法.通过提取出的特征参数(MFCC和LPCC),建立系统模型,实验结果表明,将新颖检测法结合VQ用于特征向量的分类,较之于单纯的VQ分类,取得了识别率高、稳健型强、确认可靠的效果. 相似文献

7.

CPSO聚类和KMP相结合的说话人识别方法

李晶皎安冬杨丹王骄《小型微型计算机系统》2013,34(7)

针对目前广泛应用于说话人识别领域的MFCC特征参数包含较少说话人特征信息的问题和SVM分类器选择核函数时受到Mercer准则限制的问题,提出了一种将混沌粒子群算法(CPSO)与核匹配追踪算法(KMP)相结合的说话人识别方法.首先通过CPSO聚类算法将MFCC特征参数进行变换处理,得到精简的MFCC特征参数(SMFCC),然后利用KMP算法对核函数的形式没有任何限制的特性和良好的分类识别性能,对约简后的SMFCC特征参数进行分类训练和识别.仿真实验结果表明,基于CPSO-KMP说话人识别方法相比主流的GMM-UBM方法,在EER性能上相对提高了31％. 相似文献

8.

反蓄意模仿说话人识别系统中特征参数提取的研究

《微型机与应用》2016,(12):18-20

当模仿者蓄意模仿说话人的语音且相似度极高时,说话人识别系统就有可能被欺骗。特征参数的提取是说话人识别的关键环节,直接影响了系统的识别性能。MFCC是语音识别中最热门的特征参数之一,但由于其只反映了语音的静态特性,为了提取更具个人语音特性的特征参数,引入加权MFCC,同时结合离散小波变换得到DWTWC,根据增减分量法,提出了DWI-MFCC。实验表明,DWI-MFCC倒谱系数比MFCC能更有效地区分语音的相似度。相似文献

9.

基于MFCC和LPCC的说话人识别 总被引：8，自引：0，他引：8

余建潮张瑞林《计算机工程与设计》2009,30(5)

MFCC参数和LPCC参数是说话人识别中两种最常用的特征参数,研究了MFCC和LPCC参数提取的算法原理及差分倒谱参数的提取方法,采用MFCC、LPCC及其一阶、二阶差分作为特征参数,通过k均值算法与三层BP神经网络来进行说话人识别.实验结果表明,该方法可以有效提高识别率,同时也验证MFCC参数的鲁棒性优于LPCC参数. 相似文献

10.

一种改进的语音动态组合特征参数提取方法

钟浩鲍鸿张晶《电脑与信息技术》2017,25(3)

语音信号窗函数具有减少频谱能量泄露的作用,针对传统的语音加窗函数旁瓣衰减速度慢,信号频谱能量泄露大,不利于说话人识别特征参数提取的缺点,采用一种汉明自卷积窗函数取代汉明窗函数对语音信号预处理.为了进一步提高说话人系统的识别率,文章提出一种基于汉明自卷积窗的的一阶、二阶差分梅尔倒谱系数(MFCC)改进的动态组合特征参数方法.用高斯混合模型进行仿真实验,实验结果证明,用该方法提取的特征参数运用于说话人识别系统,相比于传统的MFCC说话人识别系统,其识别率大大提高. 相似文献

11.

基于听皮层神经元感受野的强噪声环境下说话人识别

牛晓可黄伊鑫徐华兴蒋震阳《计算机应用》2020,40(10):3034-3040

针对说话人识别易受环境噪声影响的问题,借鉴生物听皮层神经元频谱-时间感受野（STRF）的时空滤波机制,提出一种新的声纹特征提取方法。在该方法中,对基于STRF获得的听觉尺度-速率图进行了二次特征提取,并与传统梅尔倒谱系数（MFCC）进行组合,获得了对环境噪声具有强容忍的声纹特征。采用支持向量机（SVM）作为分类器,对不同信噪比（SNR）语音数据进行测试的结果表明,基于STRF的特征对噪声的鲁棒性普遍高于MFCC系数,但识别正确率较低;组合特征提升了语音识别的正确率,同时对环境噪声具有良好的鲁棒性。该结果说明所提方法在强噪声环境下说话人识别上是有效的。相似文献

12.

基于发声机理与人耳感知特性的说话人识别

杜晓青于凤芹《计算机工程》2013,(11):197-199,204

Mel频率倒谱系数（MFCC）与线性预测倒谱系数（LPCC）融合算法只能反映语音静态特征,且LPCC对语音低频局部特征描述不足。为此,提出将希尔伯特黄变换（HHT）倒谱系数与相对光谱一感知线性预测倒谱系数（RASTA—PLPCC）融合,得到一种既反映发声机理又体现人耳感知特性的说话人识别算法。HHT倒谱系数体现发声机理,能反映语音动态特性,并更好地描述信号低频局部特征,可改进LPCC的不足。PLPCC体现人耳感知特性,识别性能强于MFCC,用3种融合算法对两者进行融合,将融合特征用于高斯混合模型进行说话人识别。仿真实验结果表明,该融合算法较已有的MFCC与LPCC融合算法识别率提高了8．0％。相似文献

13.

说话人识别中基于Fisher比的特征组合方法

谢小娟曾以成熊冰峰《计算机应用》2016,36(5):1421-1425

为了提高说话人识别的准确率,可以同时采用多个特征参数,针对综合特征参数中各维分量对识别结果的影响可能不一样,同等对待并不一定是最优的方案这个问题,提出基于Fisher准则的梅尔频率倒谱系数(MFCC)、线性预测梅尔倒谱系数(LPMFCC)、Teager能量算子倒谱参数(TEOCC)相混合的特征参数提取方法。首先,提取语音信号的MFCC、LPMFCC和TEOCC三种参数;然后,计算MFCC和LPMFCC参数中各维分量的Fisher比,分别选出六个Fisher比高的分量与TEOCC参数组合成混合特征参数;最后,采用TIMIT语音库和NOISEX-92噪声库进行说话人识别实验。仿真实验表明,所提方法与MFCC、LPMFCC、MFCC+LPMFCC、基于Fisher比的梅尔倒谱系数混合特征提取方法以及基于主成分分析(PCA)的特征抽取方法相比,在采用高斯混合模型(GMM)和BP神经网络的平均识别率在纯净语音环境下分别提高了21.65个百分点、18.39个百分点、15.61个百分点、15.01个百分点与22.70个百分点;在30 dB噪声环境下,则分别提升了15.15个百分点、10.81个百分点、8.69个百分点、7.64个百分点与17.76个百分点。实验结果表明,该混合特征参数能够有效提高说话人识别率,且具有更好的鲁棒性。相似文献

14.

短语音噪声环境下说话人识别特征提取

高会贤马全福郑晓势《计算机应用》2010,30(10):2712-2714

为了使说话人识别系统在语音较短和存在噪声的环境下也具有较高的识别率,基于矢量量化识别算法,对提取的特征参数进行研究。把小波变换与美尔频率倒谱系数(MFCC)的提取相结合,并将改进后的特征与谱质心特征进行了组合,建立了一种美尔频率小波变换系数+谱质心(MFWTC+SC)的新的组合特征参数。经实验表明,该组合特征可以有效地提高说话人识别系统的性能。相似文献

15.

基于听皮层神经元感受野的强噪声环境下说话人识别

牛晓可黄伊鑫徐华兴蒋震阳《计算机应用》2005,40(10):3034-3040

针对说话人识别易受环境噪声影响的问题，借鉴生物听皮层神经元频谱-时间感受野（STRF）的时空滤波机制，提出一种新的声纹特征提取方法。在该方法中，对基于STRF获得的听觉尺度-速率图进行了二次特征提取，并与传统梅尔倒谱系数（MFCC）进行组合，获得了对环境噪声具有强容忍的声纹特征。采用支持向量机（SVM）作为分类器，对不同信噪比（SNR）语音数据进行测试的结果表明，基于STRF的特征对噪声的鲁棒性普遍高于MFCC系数，但识别正确率较低；组合特征提升了语音识别的正确率，同时对环境噪声具有良好的鲁棒性。该结果说明所提方法在强噪声环境下说话人识别上是有效的。相似文献

16.

基于端点检测和高斯滤波器组的MFCC说话人识别

王萌王福龙《计算机系统应用》2016,25(10):218-224

在上下文无关的说话人识别应用中,针对传统MFCC特征参数在语音预处理方面不足以及三角滤波器组的缺陷,提出一种改进的MFCC特征参数提取方法.一方面在传统算法上加入端点检测,去除与说话人语音特征无关的静音段;另一方面用高斯滤波器组（Gaussian shaped filters GF）代替三角滤波器组进行频率到Mel频率的转换,提高识别准确率.说话人识别模型使用流行的高斯混合模型（GMM）.实验结果显示,高斯滤波器组的引入相比于传统三角滤波器组识别率有4.45%的提升,本文改进后的MFCC特征参数相比于传统方法识别率也提升了6.43%,能更好的代表说话人的语音特征. 相似文献

17.

基于MFCC和加权矢量量化的说话人识别系统 总被引：14，自引：4，他引：14

邵央刘丙哲李宗葛《计算机工程与应用》2002,38(5):127-128

文章介绍的说话人识别系统,采用能够反映人对语音的感知特性的Mel频率倒谱系数(Mel-FrequencyCeptralCoefficients,MFCC)作为特征参数,同时考虑到特征参数各维分量对于不同说话人的区分程度,采用加权的办法进行矢量量化。取得了很好的结果,系统训练和识别计算量和存储量都比较低。相似文献

18.

基于改进LPCC和MFCC的汉语耳语音识别 总被引：5，自引：0，他引：5

下载免费PDF全文

荣薇陶智顾济华赵鹤鸣《计算机工程与应用》2007,43(30):213-216

以提高汉语耳语的识别率为目的,提出了将MFCC、LPCC及它们各自的动态参数等多种特征有效结合进行耳语识别的方法。实验结果说明了LPCC、MFCC结合动态参数可作为汉语耳语音识别的特征参数,且它们的结合提高了系统的识别率,在小字库内得出的识别率为94.5%。相似文献

19.

衡阳方言孤立词识别研究

李荣华赵征鹏《计算机系统应用》2017,26(5):247-252

目前,汉语识别已经取得了一定的研究成果.但由于中国的地域性差异,十里不同音,使得汉语识别系统在进行方言识别时识别率低、性能差.针对语音识别系统在对方言进行识别时的缺陷,构建了基于HTK的衡阳方言孤立词识别系统.该系统使用HTK3.4.1工具箱,以音素为基本识别单元,提取39维梅尔频率倒谱系数（MFCC）语音特征参数,构建隐马尔可夫模型（HMM）,采用Viterbi算法进行模型训练和匹配,实现了衡阳方言孤立词语音识别.通过对比实验,比较了在不同因素模型下和不同高斯混合数下系统的性能.实验结果表明,将39维MFCC和5个高斯混合数与HMM模型结合实验时,系统的性能得到很大的改善. 相似文献