首页 | 官方网站   微博 | 高级检索  
     

基于双路卷积神经网络的中文语音识别
引用本文:张昱,李鸿燕,邢璐,任健.基于双路卷积神经网络的中文语音识别[J].计算机工程与设计,2023(3):880-886.
作者姓名:张昱  李鸿燕  邢璐  任健
作者单位:太原理工大学信息与计算机学院
基金项目:山西省自然科学基金项目(201701D121058);;山西省回国留学科研基金项目(2020-042);
摘    要:为解决卷积神经网络在中文语音识别中识别准确率低、鲁棒性差的问题,提出一种基于双路卷积神经网络的声学建模方法。利用多尺度学习方法提取多尺度特征信息;将软阈值非线性转换层和注意力机制进行融合后嵌入残差网络,减轻网络梯度问题,加强网络特征信息传递,提高特征学习效果;采用连接时序分类技术分类,简化语音识别流程。实验结果表明,该模型与传统识别模型相比,词错误率降低了7.52%,在3种噪声环境下,错误率也低于传统模型。

关 键 词:语音识别  多尺度学习  软阈值  注意力机制  残差网络  连接时序分类  端到端
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号