期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

秦晨光王海任杰郑杰袁璐赵子鑫《计算机研究与发展》2019,56(12):2632-2640

近年来深度学习尤其是神经网络的发展,对语音识别这类复杂的模式分类问题提供了新的解决思路.为加强对我国方言语种的保护工作、提高方言语种识别的准确率以及丰富语音识别的前处理模块,首先采用目前语音识别领域应用最广泛的LSTM模型搭建单任务方言语种识别模型SLNet作为基线系统.其次,针对中国方言的多样性、复杂性特点,基于多任务学习的参数共享机制,通过多任务神经网络模型发现不同语种间的隐含相关特性,提出基于多语种任务的方言语种识别模型MTLNet.进一步根据中国方言的区域特点,采用基于参数硬共享的多任务学习模式,构建基于辅助任务的多任务学习神经网络ATLNet.经实验验证表明：相比于单任务神经网络方言语种识别,MTLNet和ATLNet将识别准确率可提升至80.2%,弥补了单任务模型的单一性和弱泛化性. 相似文献

2.

基于深度学习的方言语音识别模型构建

郝焕香《自动化与仪器仪表》2022,(4):48-51

为了提高方言语音识别效果,提出一种基于深度学习的方言语音识别模型。首先结合CTC和Attention架构的互补特点,构建基于端到端的混合CTC/Attention语音识别模型;其次构建多样化的方言数据库作为训练和测试数据,然后在特征提取基础上,利用混合CTC/Attention语音模型对方言进行识别。结果表明,该模型无论是在识别准确率、错误率,还是在模型收敛性和整体识别结果上,基于混合CTC/Attention语音识别模型的识别效果更好。相似文献

3.

基于卷积神经网络的语音识别分析

刘佩林张钰玲《电脑迷》2017,(1)

引言:随着计算机计算能力的提升,如何让计算机更多的替代人类脑力资源,让计算机能具有学习能力变成了最为前沿的领域.这种计算机自我学习的方式被称为深度学习,而将深度学习与多媒体技术结合则是当前最有价值的研究领域之一.本文着重介绍了计算机基于卷积神经网络的深度学习在语音识别方面的价值与趋势分析. 相似文献

4.

管制指令语音识别在模拟飞行界面的实现

陈亚青蒋豪韩丹《计算机系统应用》2016,25(11):265-269

将语音识别技术应用到管制学员的培训中是提高管制模拟机应用效率的重要途径.在深入分析中文管制指令特征的基础上,从语音识别基础技术出发,设计一套适合于中英文管制指令语音特点的语音识别技术,利用MATLAB完成相应程序的编写和模拟飞行界面的设计.通过形成独特的管制指令语音识别模板库,最终在模拟飞行界面实现管制语音指令对航空器飞行的控制.从而为进一步实现自动化模拟机机长席位提供可能,最终完全替代人工机长席位. 相似文献

5.

神经网络与语音识别

杨柳扬《中国计算机用户》1991,(4):25-28

相似文献

6.

语音识别中声学模型研究综述

叶硕褚钰王祎李田港《计算机技术与发展》2020,(3):181-186

智能语音技术包含语音识别、自然语言处理、语音合成三个方面的内容,其中语音识别是实现人机交互的关键技术,识别系统通常需要建立声学模型和语言模型。神经网络的兴起使声学模型数量急剧增加,基于神经网络的声学模型与传统识别模型相结合的方式,极大地推动了语音识别的发展。语音识别作为人机交互的前端,具有许多研究方向,文中着重对语音识别任务中的文本识别、说话人识别、情绪识别三个方向的声学模型研究现状进行归纳总结,尽可能对语音识别技术的演化进行细致介绍,为以后的相关研究提供有价值的参考。同时对目前语音识别的主流方法进行概括比较,介绍了端到端的语音识别模型的优势,并对发展趋势进行分析展望,最后提出当前语音识别任务中面临的挑战。相似文献

7.

老龄化背景下居家养老系统方言识别算法应用研究——以粤语为例

闫凯宋烨刘瑜杨莉张浩源《信息与电脑》2023,(2):120-122

我国语音识别技术已达国际水平,但是针对低资源语音识别的研究成果较少。文章以粤语方言为例,建立老年方言语料库,并基于神经网络方法构建高斯混合模型(Gaussian Mixture Model,DNN)-隐马尔可夫模型(Hidden Markov Model,HMM)处理语料库声学特征,使用N-gram语言模型解码特征状态。经实验证明,设计方法识别准确率较高,在以语音识别为核心的智能居家养老系统中具有一定的应用价值。相似文献

8.

基于深度学习的语音识别技术现状与展望 总被引：1，自引：0，他引：1

戴礼荣张仕良黄智颖《数据采集与处理》2017,32(2):221-231

首先对深度学习的发展历史以及概念进行简要的介绍。然后回顾最近几年基于深度学习的语音识别的研究进展。这一部分内容主要分成以下5点进行介绍：声学模型训练准则,基于深度学习的声学模型结构,基于深度学习的声学模型训练效率优化,基于深度学习的声学模型说话人自适应和基于深度学习的端到端语音识别。最后就基于深度学习的语音识别未来可能的研究方向进行展望。相似文献

9.

探究端到端的深度卷积神经网络语音识别

《软件》2022,43(3)

相似文献

10.

汉语语音识别实用系统研究 总被引：1，自引：0，他引：1

姚键古碧绮《计算机工程》1999,25(4):12-13,52

在分析了传统音识别方法的特点后,提出一种规则结合模型的语音识别思想,并实现了特征空间轨迹匹配＋神经网络”方法作为例证。相似文献

11.

重庆方言语音识别系统的设计与实现

张策韦鹏程陆晓燕石熙《计算机测量与控制》2018,26(1)

语音识别赋予了计算机能够识别出语音内容的功能,是人机交互技术领域的重要研究内容。随着计算机技术的发展,语音识别已经得到了成熟的发展。但是关于方言的语音识别还有很大的发展空间。中国是一个幅员辽阔、人口众多的国家,因此方言种类繁多,其中有3000多万人交流使用的重庆方言就是其中之一。采集了重庆方言的部分词语的文本文件和对应的语音文件建立语料库,根据重庆方言的发音特点,选取重庆方言的声韵母作为声学建模基元,选取隐马尔可夫模型(Hidden Markov Model, HMM)为声学模型设计了一个基于HMM的重庆方言语音识别系统。在训练过程利用语料库中训练集语料对声学模型进行训练,形成HMM模型库;在识别过程利用语料库中的测试集语料进行识别测试。实验结果表明,该系统能够实现重庆方言的语音识别,并且识别的正确率为100%。相似文献

12.

小语料库重庆话语音识别的研究

下载免费PDF全文

张策韦鹏程石熙《计算机测量与控制》2018,26(11):252-255

随着计算机技术的发展,人工智能产品已经开始广泛地应用在各个领域。利用地区方言与人工智能产品进行交流成为了人机交互技术领域一个重要的研究方向。地处西南的重庆市为国家定位的国际大都市,世界各种文化伴随着人流汇聚于此。承载着重庆本土文化的重庆话作为重庆地区的主要交流语言,研究重庆话语音识别在推动人工智能产品本土化有着积极的作用。本文以重庆话为研究对象,建立了重庆话和重庆话口音的普通话小语料库,搭建了以HMM为声学模型的语音识别系统,分别以重庆话和重庆话口音的普通话作为声学模型去分别识别重庆话和带重庆话口音的普通话。实验表明,重庆话和重庆话口音的普通话声学模型去识别对应语音的正确识别率均为100%;重庆话声学模型识别重庆口音的普通话的正确识别率达到78.89%,重庆话口音的普通话声学模型去识别重庆话的正确识别率达到91.67%。相似文献

13.

多信息融合的汉语方言辨识

夏玉果戴红霞顾明亮徐敏《电脑与信息技术》2009,17(5):32-36

文章提出了一种融合声学、音素配位和韵律特征等多信息融合的汉语方言辨识系统,分析了将语言信息转化为这些特征的实验方法,在此基础上,根据汉语方言辨识的特点,提出了一种基于概率模型的多信息辨识机制,实验结果表明,韵律特征对于短时语音具有很好的辨识效果,而音位配列特征对于长时语音更加有效。对于汉语三种方言的辨识,融合这三种特征的辨识率达95％。相似文献

14.

基于 PCA 和 LDA 的方言辨识

何艳于凤芹《计算机系统应用》2012,21(5):169-171,179

针对PCA没有有效利用样本的类别信息而导致方言识别率低的问题,采用PCA和LDA组合方法进行特征提取。首先用PCA对普通话、上海话、广东话和闽南话四种方言进行降维,然后在降维后的空间中用LDA进一步特征提取,最后将该特征向量送入BP神经网络进行辨识。仿真实验结果表明,基于PCA和LDA的方言识别的平均识别率高达85%。相似文献

15.

基于动态贝叶斯网络的汉语方言辨识

周杰顾明亮张宁杨帆《计算机技术与发展》2012,(11):179-182

方言的差异性在语音层面上反映在时间序列结构的不同。传统的语音建模方法只能建立稳定的时间序列结构,而方言语音是典型的动态时变时间序列结构。为了更好地提取方言时间序列结构,文中采用动态贝叶斯网路（DBN）进行建模分析,并对DBN的构建方法进行了研究,这种结构与常用于语音识别中的隐马尔可夫模型的不同之处在于它揭示多个时间片内的节点之间的影响。文中探索了不同结构和参数对识别效果的影响。文中的研究表明动态贝叶斯网络对汉语方言的识别比传统方法要好,识别率达到了98．9％。相似文献

16.

可扩展处理器中最大凸自定义指令迭代识别研究

王珊珊刘万军肖成龙《计算机研究与发展》2018,55(7):1584-1596

由于可扩展处理器能够在设计周期、灵活性、性能以及功耗等方面提供良好的折中,近年来,可扩展处理器大量地在嵌入式系统和电子设备中使用.自定义指令自动识别是可扩展处理器设计的关键.针对自定义指令自动识别问题,提出并实现了从给定的应用程序代码中自动识别最大凸自定义指令(maximal convex subgraphs, MCSs)的迭代设计流程.提出的设计流程解决了2个关键问题：MCSs自动枚举问题和MCSs自动选择问题.针对MCSs枚举问题,提出了一种夹心方式枚举所有候选最大凸自定义指令,该算法结合了自下而上和自顶向下方式的优点.与最新算法相比,提出的算法可以实现数量级的加速.针对MCSs选择问题,提出了一种利用候选指令之间的重叠关系建立兼容图,并应用非重叠规则来修剪大量的搜索空间的精确选择算法.实验结果表明：利用提出的精确算法,在大多数情况下可以找到用于最大化提升性能的MCSs. 相似文献

17.

基于聚类支持矢量机的汉语方言辨识

夏玉果顾明亮《计算机与数字工程》2012,40(5):15-17,37

该文提出了一种新的汉语方言辨识方法,来解决在总多辨识系统中存在的较弱辨识能力的问题,这种新方法运用高斯混合模型和N元语言模型,来产生一个全局的语言特征,然后使用聚类支持矢量机来做最后的分类。实验结果表明该方法不仅可以提高正确的辨识率,而且可以提高系统的鲁棒性。相似文献

18.

工厂自动化通信发展综述

牟连佳《计算机测量与控制》2008,16(10):1366-1370

由局域和广域网以及有线和无线通信系统组成的异构网络将发挥日益重要的作用;然而,需要的不仅只是实时、安全和保密的通信,渴望的情境感知也将通向基于现场的通信服务;因此,这些功能性将越来越多的影响自动化领域通信方法的复杂性;由于目前现场总线系统已在工厂自动化领域达到一个稳定阶段,所以将主要探讨在自动化领域内使用以太网和异构网络的近期发展情况,并指出未来的分布式自动化系统需要使用更多的机制以便于适应自动化功能的地理分布。相似文献

19.

基于基频的朝鲜语方言辨识方法的研究

刘双君金小峰崔荣一《中文信息学报》2017,31(2):55-60

该文提出了一种基于基音频率特征的中国朝鲜族语言、韩国朝鲜语和朝鲜朝鲜语方言的自动辨识方法。首先,选择具有良好区分度的基频移位差分系数作为三个方言的特征参数;其次,设计和采用了分层支持向量机分类器,并进一步引入投票法确定最佳的分类结果。实验结果表明该文提取的特征参数具有良好的区分性和较强的稳定性,该文提出的方言辨识方法比传统的移位差分倒谱系数特征方法识别率高,可以有效解决朝鲜朝鲜语、韩国朝鲜语和中国朝鲜族语言的方言辨识问题。相似文献