首页 | 官方网站   微博 | 高级检索  
     

DNN模型对汉语电话录音识别的研究与比较
引用本文:孔玲军,李艳.DNN模型对汉语电话录音识别的研究与比较[J].福建电脑,2022,38(3):52-54.
作者姓名:孔玲军  李艳
作者单位:南开大学滨海学院 天津 300270
摘    要:深度神经网络DNN(Deep Neural Network)是近年机器学习理论中被诸多研究者广泛关注的语音识别模型。DNN模型利用DNN的学习能力可提升对噪声和口音的鲁棒性,在很多大规模语音识别任务中都超过了GMM模型。本文基于DNN与HMM特点,提取40维的MFCC特征向量后,利用DNN的每个输出节点估计HMM每个状态的后验概率,进而得到了对电话录音场景下的模型参数。最后,对1000小时的汉语电话录音和公开汉语语料集thchs-30上进行三次模型训练设计实验,并对比GMM-HMM模型参数效果。实验结果表明,DNN-HMM模型在1000小时的电话录音测试集上误识率降低了5.84%-9.42%,且两种模型识别效果表现得都比较稳定。

关 键 词:DNN  GMM  电话录音  Kaldi

Research and Comparison of DNN Model for Chinese Telephone Recording Recognition
KONG Lingjun,LI Yan.Research and Comparison of DNN Model for Chinese Telephone Recording Recognition[J].Fujian Computer,2022,38(3):52-54.
Authors:KONG Lingjun  LI Yan
Affiliation:(Binhai College,Nankai University,Tianjin,China,300270)
Abstract:
Keywords:
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号