期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

基于组合神经网络的与文本无关的说话人识别 总被引：1，自引：1，他引：0

陈若珠李战明王贞《兰州理工大学学报》2006,32(3):78-81

提出了一种用于N个说话人识别的组合神经网络,由N个子网组成,每个子网完成两类模式区分,将这N个子网组合起来完成N类模式的区分.子网选用RBF神经网络,并给出了自组织选取中心的方法.实验显示,对6名说话人,识别率达到94%.对10名说话人,识别率达93.17%. 相似文献

2.

基于语音识别的说话人身份辨识系统 总被引：2，自引：0，他引：2

程利忠张宪民《上海交通大学学报》1998,32(9):86-89

提出一种在小字库孤立语音条件下,集成语音识别与说话人的识别技术,并进行说话人身份代码（密码）识别、认证．利用语音信号的短时分析技术进行孤立词的单元分割,采用临界带特征矢量作为语音信号特征,分析了经典语音识别算法——动态时间规整算法,提出了对语音模板各帧加权的改进方法．为提高识别响应速度,研究了多门限多轮次的判决方法,在增加多套模板、提高识别率的情况下,降低了系统的响应时间．相似文献

3.

语音的音素状态模型

李海洲徐秉铮《华南理工大学学报(自然科学版)》1992,20(4):18-25

本文中我们定义特征矢量的分布为d维高斯密度,语音序列为状态转换的马尔可夫过程,这个假设区别于标准的HMM,主要表现在状态密度函数是由具有音素标识的特征矢量进行有监督学习,每种音素标识对应于语音生成机构的一个物理状态。特征矢量由对应于各音素的语音波形段中得到。其特征空间对应于m个d维高斯密度,一个特征矢量对于每个音素状态有与之相联系的有限的生成概率。我们提出一种训练HMM=(П,A,B,)的新方法,П是一个m维的初始状态概率矢量,A是m×m的状态转移概率矩阵,B描述系统处于某一状态时出现的一定观测值的一组概率密度函数,它在本算法中不需要参加模型的优化训练。相似文献

4.

语音识别和说话人识别中各倒谱分量的相对重要性 总被引：37，自引：0，他引：37

甄斌吴玺宏刘志敏迟惠生《北京大学学报(自然科学版)》2001,37(3):371-378

采用增减特征分量的方法研究了MFCC各维倒谱分量对说话人识别和语音识别的贡献。使用DTW测度,在标准英文数字语音库上的实验表明,最有用的语音信息包含在MFCC分量C₁到C₁₂之间,最有用的说话人信息包含在MFCC分量C₂到C₁₆之间。MFCC分量C₀和C₁包含有负作用的说话人信息,将其作为特征会引起识别率的降低。低阶MFCC分量较高阶分量更容易受加性噪声和卷积噪声干扰。相似文献

5.

距离加权矢量量化文本无关的说话人识别 总被引：10，自引：0，他引：10

张炜胡起秀吴文虎《清华大学学报(自然科学版)》1997,(3)

本文在研究说话人识别的矢量量化方法时，分析了用矢量量化建立说话人识别模型的可行性。针对量化码本描述的不完全性，提出了一种经距离加权的矢量量化方法，能更好地刻划出说话人语音特征空间的精细结构，从而提高正识率。本文还对特征参数ＬＰＣＣＥＰ的选取进行了理论分析和实验研究，提出了平均互—自差异比的概念，给出了一种对特征矢量的每一维分量识别能力进行定量化估算的公式。实验结果表明，距离加权矢量量化是一种具有很高正识率的与文本无关的说话人识别方法。相似文献

6.

神经网络预测模型的说话人识别算法

江太辉《五邑大学学报(自然科学版)》2003,17(1):23-26

将神经网络预测模型（NPM）应用于说话人识别中，经过实验，获得了较满意的结果。这说明神经网络对于说话人识别是一种很有潜力的方法。相似文献

7.

连续语音识别中的说话人快速自适应技术 总被引：2，自引：0，他引：2

吕萍吴及王作英陆大 《清华大学学报(自然科学版)》2002,42(7):977-980

语音识别技术中说话人快速自适应技术受到普遍关注。该文综述了说话人快速自适应技术在国际上的研究现状 ,并且介绍了本研究组提出的快速自适应方法 ,即最大似然模型插值快速自适应框架及插值算法。与现有的相关自适应方法相比 ,该算法在更复杂的识别系统上同时实现了均值和协方差的自适应 ,并取得较好的自适应效果。当仅有一句自适应数据时 ,识别系统的误识率从 2 8.75 %下降到2 4 .93%。相似文献

8.

基于结构化特征语音模型的区别性说话人自适应算法

蔡铁朱杰《上海交通大学学报》2005,(Z1)

针对特征语音说话人自适应算法的缺陷,提出了基于结构化特征语音模型的区别性说话人自适应方法.该算法能根据自适应数据量调整自适应参数,并采用基于最大互信息量准则的区别性参数估计方法,进一步提高了自适应性能.有监督自适应的实验结果表明,在仅有一句自适应语句的情况下系统误识率相对下降了6.7%,同时算法表现出了优于特征语音自适应方法的渐进性能. 相似文献

9.

多特征组合多分类器的方法用于“文本无关”的说话人辨认

王岚陈珂《北京大学学报(自然科学版)》1998,34(2):275-282

组合多分类器可以看作是一种用于获得较高识别效果的混合系统，重点探索了以不同特征作为输入的组合多分类器方法。实验结果表明：利用多特征组合多分类器的方法可以提高“文本无关”说话人辨认系统的识别率和可靠性。相似文献

10.

概率神经网络在文本无关说话人识别中的应用

周长锋韩力群《北京工商大学学报(自然科学版)》2007,25(1):49-51

采用基于听觉特性的Mel频率倒谱系数作为说话人识别特征参数,对概率神经网络进行了描述,并使用该网络进行了文本无关说话人识别研究.实验表明,对20名说话人,用7秒语音训练,3秒语音识别时,该方法可达到96.7%的正确识别率. 相似文献

11.

基于超音段韵律特征和GMM-UBM的文本无关的说话人识别

许东星戴蓓缮刘青松许敏强《中国科学技术大学学报》2010,40(2)

提出一种采用超音段韵律特征和GMM-UBM模型结构的文本无关的说话人识别方法,用多尺度小波分析方法从短时倒谱参数MFCC和基频F0随时间变化的韵律中分别提取可用于文本无关说话人识别的超音段韵律特征参数PMFCC和PF0,并组成联合参数PMFCCF0.在NIST068side-1side复杂背景电话手机语音数据库上的说话人确认实验则表明,采用一阶小波分析方法提取的超音段韵律参数PMFCC的识别性能与短时MFCC相当,采用超音段韵律特征PMFCCF0的系统确认性能比采用短时MFCC系统有较大的提高.在微软数据库进行不同信噪比测试语音的说话人辨认实验表明,PMFCCF0有比短时MFCC更好的噪声鲁棒性. 相似文献

12.

基于听觉模型特征的与文本无关说话人识别系统

卢小春尹俊勋王修信《广西师范大学学报(自然科学版)》2010,28(2)

基于听觉生理和心理学的感知机理,提出一种适于说话人识别的特征参数提取方法。该方法采用Gammatone滤波器组代替常用的三角形滤波器组计算出语音信号各子带能量,根据等效矩形带宽模型,确定了各个滤波器的中心频率与带宽。同时从语音信号各子频带携带的说话人个性特征信息量角度分析对滤波器子带进行加权处理,最后结合倒谱均值减方法对特征进行处理,最终生成具有较高鲁棒性的特征。采用高斯混合模型对说话人进行建模,仿真实验的结果表明:提出的特征参数对含噪语音的与文本无关说话人识别具有较好的效果,在低信噪比情况下,具有比传统特征参数更好的噪声鲁棒性。相似文献

13.

说话人识别信道补偿技术HNSSM

周静芳陈一宁刘加刘润生《清华大学学报(自然科学版)》2004,44(7):942-945

在说话人识别系统中,训练语音与测试语音的话机类型失配会使说话人识别系统识别性能显著下降。为了提高说话人识别系统的稳健性,在说话人模型合成和话机归一化的基础上提出一种新的信道补偿方法HNSSM(handsetnormalizationinsynthesizedspeakmodel),综合模型和分数两个方面对系统进行信道补偿。1999年美国国家标准技术局说话人识别评测语音库上的实验表明,采用新的信道补偿方法使系统在等错误率和最小检测代价上比仅采用倒谱均值减的基线系统分别降低了39.4%和20.9%,而且优于只采用说话人模型合成或话机归一化补偿的系统。相似文献

14.

基于FVQMM的说话人识别

成新民张迎蒋云良《辽宁工程技术大学学报(自然科学版)》2007,26(5):719-722

为了克服传统VQ与GMM说话人识别的缺点,提出了一种新的FVQMM说话人识别方法。该方法综合了VQ、GMM和模糊集理论的优点。通过用模糊VQ误差尺度取代传统GMM的输出概率函数,减少了建模时对训练数据量的要求,提高了识别速度。实验结果表明该方法是有效的。相似文献

15.

说话人识别技术——语音特征参数提取及组合

张喜宁《科技资讯》2009,(34):231-232

本论文重点对语音特征参数的组合进行了研究,通过参数的特征组合从不同的角度来反映说话人的个性特征,能够大大提高说话人识别系统的识别率。对其中的特征参数（MFCC及LPCC）的特性及提取过程进行了详细的解释和仿真。相似文献

16.

基于高斯混合模型的说话人识别系统 总被引：2，自引：0，他引：2

朱青松吴仕明张海斌《黑龙江科技学院学报》2004,14(2):113-116

针对概率得分均值法出现的单个帧概率打分容易畸低的情况以及投票法因归一化而损失掉正面影响帧的打分，提出了一种引入可信度的均值方法，实验证明：该方法兼顾二者的优势的同时，在一定程度上消除了各自产生的不利影响，提高了说话人识别的精度。相似文献

17.

一种新型的与文本相关的说话人识别方法研究

周雷龙艳花魏浩然《上海师范大学学报(自然科学版)》2017,46(2):224-230

在与文本相关的说话人识别研究中,既要包含说话人身份的识别,又要包含语音文本内容的识别.提出一种基于语音识别的与文本相关的说话人识别方法,从而建立说话人的声纹模型和语音文本模型,与传统的仅建立一种模型的方法相比,该方法能更精确地描述说话人身份信息和语音的文本信息,较好地解决了短时语音样本识别效果不佳的问题.测试实验表明,和传统与文本相关的说话人识别方法(如基于动态时间规整、高斯混合-通用背景模型)相比,由本方法建立的系统虚警概率降低了8.9%,识别性能得到了提高. 相似文献

18.

基于MFCC等组合特征的说话人识别模型

朱建伟孙水发刘晓丽《三峡大学学报(自然科学版)》2009,31(6):77-79,93

为了有效提取语音特征,提高说话人识别的准确率,系统采用基于有限状态机的端点检测算法对原始语音做VAD处理,提出了新的特征组合参数：基于人的听觉特性的MFCC参数、基于发音生理特征的基音轮廓特征以及衍生的基音周期一阶差分、基音周期变化率,并将它们作为说话人识别系统的特征参数,建立了基于VQ的识别模型.实验表明：本文系统使用VAD,使系统的识别率提高了5%8%,较单独使用MFCC参数的说话人识别系统的识别率提高了2%3%. 相似文献

19.

变异特征加权的异常语音说话人识别算法 总被引：1，自引：1，他引：0

何俊李艳雄贺前华李威《华南理工大学学报(自然科学版)》2012,40(3):106-111

常用的加权算法难以跟踪非常态语音特征的变异,为此,文中提出了一种变异特征加权的异常语音说话人识别算法.首先统计大量正常语音各阶MFCC特征的概率分布,建立正常语音特征模板;然后用测试语音特征与正常语音特征模板之间的K-L距离和欧氏距离来度量语音的变异程度,确定K-L加权因子和欧氏加权因子;最后利用加权因子对测试语音的MFCC特征进行加权,并将加权后的特征输入高斯混合模型进行异常语音说话人识别.实验结果表明,文中提出的K-L加权和欧氏加权的异常语音说话人识别算法的整体识别率分别为46.61%和42.25%,而基于各阶特征对说话人识别贡献的加权算法和不加权算法的整体识别率分别为39.68%和36.36%. 相似文献

20.

基于支持说话人权重的快速说话人自适应算法

蔡铁朱杰《上海交通大学学报》2005,39(12):1997-2001

针对语音识别系统中快速说话人自适应问题,提出了一种支持说话人权重算法．该算法通过支持说话人的计算实现了说话人选择与自适应参数的降维,减少了自适应时的存储量,有效提高了自适应数据较少时的性能．有监督自适应的实验结果表明,在仅有一句自适应语句的情况下系统误识率相对非特定人（SI）系统下降了5．82％,明显优于其他快速自适应算法．相似文献