共查询到20条相似文献,搜索用时 15 毫秒
1.
2.
通过分析作为机载远程通信主要手段的短波电台在强干扰及超远距离等极限条件下面临的失效风险,针对性地设计了基于语音识别技术的机载短波应急通信方案。该方案通过语音识别技术将语音信号转换为语义信息进行传输。采用提出的嵌入式命令词语音识别技术、说话人自适应技术和噪声鲁棒性语音识别技术提高语音识别的性能,保证基于语音识别技术的机载短波应急通信方法的实现,从而可以在上述情况下为飞行员提供应急通信保障。 相似文献
3.
结合维吾尔语的语音特征和语义信息,在大量电话语音语料库的基础上,以建立维吾尔语连续音素识别平台为目标,通过构建隐马尔科夫模型工具HTK(Hidden Markov Model Toolkit)工具实现了维吾尔语连续音素识别算法:首先根据具体技术指标完成了较大规模电话语音语料库的录制和标注工作;确定音素为基元,通过训练获得了每个音素的HMM(Hidden Markov Model)声学模型,随后对输入的语音进行识别,声学模型在不同的高斯混合数目下,得出了识别结果;统计了32个音素的识别率并对它进行分析,为了进一步提高识别率奠定了基础。 相似文献
4.
《无线互联科技》2015,(11)
该研究旨在为行动不便的残障人士或者老年人的家居生活提供便利和帮助,使他们能够通过语音识别系统对家用电器、照明系统、门窗开关等实现智能控制。通过查找资料,对比参数、价格、识别率等方面的信息,最终采用了基于LD3320的语音识别系统进行家庭电路控制模拟应用。系统由4部分构成,即:YS-LD语音识别模块、STM32单片机控制单元、LED显示单元、继电器输出单元。LD3320语音识别芯片感应语音——通过STM32单片机运算分析——发出信号——控制继电器——电器工作。经过测试,本套系统的语音辨识率高达90%,无需用户自行建立语音模型及开发语音识别算法,降低了应用开发的技术门槛,有利于推广应用。 相似文献
5.
6.
7.
8.
给出了一种应用于电话语音自动拨号的实时语音识别方法。该系统对特定人的语音进行识别,并将识别结果映射成相应的电话号码。实验结果表明该方法具有很高的识别精度和实时的识别速度,并且只需很小的内存空间就可以实现,是一种有效的应用于电话语音自动拨号等方面的语音识别方法。 相似文献
9.
设计并实现利用语音识别对多媒体信息检索的系统。该系统综合运用分类法.主题法和基于内容的多媒体检索方法,并嵌入语音识别技术。以达到综合运用多媒体低级内容特征和高级语义特征来提高检索性能的目的,同时使得人机交互更为便利。 相似文献
10.
一种语音特征参数子分量分析与有效性评价的新方法 总被引:2,自引:0,他引:2
语音信号中包含语义和说话人个性两大特征,其有效提取和强化对语音识别和说话人识别有着非常重要的意义。本文提出了一种语音特征参数中语义和个性特征子分量分析与有效性评价的4S方法,对语义和个性特征的成份比例进行分析,并通过量化指标评判特征参数对语音识别和说话人识别的有效性。运用4S分析方法对目前常用的特征参数LPC, LPCC和MFCC的子分量分析与有效性评价结果表明,所有的特征参数都更多地包含了语义特征信息,语义特征和说话人个性特征的成份比例因子LIR分别为1.30、1.44和1.61,并且,三种参数对语音识别和说话人识别的有效性均呈现出依次提高的特性。 相似文献
11.
电子喉语音存在基频单一、发声机械、辐射噪声大等多种缺陷,这严重影响了电子喉语音可懂度和自然度,特别是对汉语普通话之类的声调语言,问题尤其严重.汉语普通话电子喉语音识别存在辅音混淆的问题并且识别结果没有声调,因此本文在识别结果的基础之上设计了拼音拼写修正器和声调标注工具,再结合基于Tacotron-2的TTS实现了电子喉语音向正常语音的转换.客观评价实验结果表明,拼音拼写修正器可以提高拼音准确率,声调标注在有上下文的语义环境中具有较高准确率.主观听力测试结果表明,本文所提方法在不同语言水平上提高了汉语普通话电子喉语音的可懂度和自然度.研究结果表明,本文设计的方法可以将不带声调的电子喉语音转换为正常语音,相比于传统语音转换方法具有更高的性能. 相似文献
12.
不良语音识别技术是在高清音视频业务中监测不良信息的有效手段。本文提出了一个基于声学模型的不良语音识别框架。并针对框架中特征提取、声学模型构建、不良语音判定模型三个重要部分的实现方法进行分析描述。并列举了各种方法的优缺点。对构建高效的不良语音识别系统具有较高的参考价值。 相似文献
13.
语音情感识别是实现自然人机交互不可缺失的部分,是人工智能的重要组成部分。发音器官的调控引起情感语音声学特征的差异,从而被感知到不同的情感。传统的语音情感识别只是针对语音信号中的声学特征或听觉特征进行情感分类,忽略了声门波和声道等发音特征对情感感知的重要作用。在我们前期工作中,理论分析了声门波和声道形状对感知情感的重要影响,但未将声门波与声道特征用于语音情感识别。因此,本文从语音生成的角度重新探讨了声门波与声道特征对语音情感识别的可能性,提出一种基于源-滤波器模型的声门波和声道特征语音情感识别方法。首先,利用Liljencrants-Fant和Auto-Regressive eXogenous(ARX-LF)模型从语音信号中分离出情感语音的声门波和声道特征;然后,将分离出的声门波和声道特征送入双向门控循环单元(BiGRU)进行情感识别分类任务。在公开的情感数据集IEMOCAP上进行了情感识别验证,实验结果证明了声门波和声道特征可以有效的区分情感,且情感识别性能优于一些传统特征。本文从发音相关的声门波与声道研究语音情感识别,为语音情感识别技术提供了一种新思路。 相似文献
14.
15.
16.
17.
《信息技术》2019,(6):91-95
随着中国经济高速发展以及全球一体化的进程,英语成为了人们日常交流必不可少的工具,然而对于初学者来说,能够通过语音识别技术将语音信号转化成文本的格式,更有利于快速掌握英语。而且语音识别技术经过多年的发展依然具有巨大的挖掘潜力,面对移动互联网的快速发展,通过对实时通信工具的大数据量的需求爆发,英语语音识别的实时性和系统稳定性越来越受到关注,文中分析了常用的传统语音识别技术,例如动态时间规整、神经网络模型和隐马尔可夫模型等,运用隐马尔可夫模型对语音信号进行处理和识别,提取出特征参数,与经过训练的模型体系进行匹配,找出最优的识别序列。然后在PC平台上,利用MATLAB建模仿真,基本实现了英语语音短句的识别,对于后续的硬件产品实现打下了良好的基础,具有积极的现实意义。 相似文献
18.
19.
20.
语音控制是互联网交互控制方式之一,它可以将人类肢体解放出来,为用户带来了非常大的便利,使得OTT业务更加多彩诱人,也使得互联网业务发生了天翻地覆的变化。随着语音识别、语音合成、语义理解、智能问答、云计算等技术的不断成熟,语音控制互联网交互业务已经进入到了实用化的阶段,并为广大用户所接受。 相似文献