首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
对比了现有IPTV/OTT通过拼音输入和语音搜索的方案,提出了一种新的基于语义的新型语音搜索方式,致力于提升语音识别准确率,并从语义表述音视频数据、整合开放的音视频数据等进行阐述,同时重点介绍了语音语句识别实现的方案以及如何通过语义实现对语音搜索结果的优化.  相似文献   

2.
通过分析作为机载远程通信主要手段的短波电台在强干扰及超远距离等极限条件下面临的失效风险,针对性地设计了基于语音识别技术的机载短波应急通信方案。该方案通过语音识别技术将语音信号转换为语义信息进行传输。采用提出的嵌入式命令词语音识别技术、说话人自适应技术和噪声鲁棒性语音识别技术提高语音识别的性能,保证基于语音识别技术的机载短波应急通信方法的实现,从而可以在上述情况下为飞行员提供应急通信保障。  相似文献   

3.
结合维吾尔语的语音特征和语义信息,在大量电话语音语料库的基础上,以建立维吾尔语连续音素识别平台为目标,通过构建隐马尔科夫模型工具HTK(Hidden Markov Model Toolkit)工具实现了维吾尔语连续音素识别算法:首先根据具体技术指标完成了较大规模电话语音语料库的录制和标注工作;确定音素为基元,通过训练获得了每个音素的HMM(Hidden Markov Model)声学模型,随后对输入的语音进行识别,声学模型在不同的高斯混合数目下,得出了识别结果;统计了32个音素的识别率并对它进行分析,为了进一步提高识别率奠定了基础。  相似文献   

4.
该研究旨在为行动不便的残障人士或者老年人的家居生活提供便利和帮助,使他们能够通过语音识别系统对家用电器、照明系统、门窗开关等实现智能控制。通过查找资料,对比参数、价格、识别率等方面的信息,最终采用了基于LD3320的语音识别系统进行家庭电路控制模拟应用。系统由4部分构成,即:YS-LD语音识别模块、STM32单片机控制单元、LED显示单元、继电器输出单元。LD3320语音识别芯片感应语音——通过STM32单片机运算分析——发出信号——控制继电器——电器工作。经过测试,本套系统的语音辨识率高达90%,无需用户自行建立语音模型及开发语音识别算法,降低了应用开发的技术门槛,有利于推广应用。  相似文献   

5.
本文首先详细介绍了语音交互技术的内容和重点,包括语音采集技术、语音识别技术、语义理解技术和语音合成技术等;之后分析了智能电视操作系统对语音交互技术的需求;最后在研究智能电视操作系统软件架构的基础上,阐述了语音交互技术在智能电视操作系统上的实现途径。  相似文献   

6.
给出了一种应用于电话语音自动拨号的实时语音识别方法。该系统对特定人的语音进行识别,并将识别结果映射成相应的电话号码。实验结果表明该方法具有很高的识别精度和实时的识别速度,并且只需很小的内存空间就可以实现,是一种有效的应用于电话语音自动拨号等方面的语音识别方法。  相似文献   

7.
随着数据处理技术的进步和人工智能领域的高速发展,用户在对仪器的实际使用中持续追求更为高效便捷的操控方式,同时也相当看重使用过程的灵活性和准确性,语音数据因其实用性和高效性而被广泛使用。因此,提出一种基于频谱分析仪的语音识别及控制软件系统。该系统支持Ubuntu 18.04及以上版本操作系统,通过语音指令实现对频谱分析仪的控制,可以实现语音唤醒、语音录入及保存、离线语音识别并转换为文字文本、可执行代码等功能。  相似文献   

8.
卢玮  姜晔 《电声技术》2001,(2):30-32
给出了一种应用于电话语音自动拨号的实时语音识别方法。该系统对特定人的语音进行识别,并将识别结果映射成相应的电话号码。实验结果表明该方法具有很高的识别精度和实时的识别速度,并且只需很小的内存空间就可以实现,是一种有效的应用于电话语音自动拨号等方面的语音识别方法。  相似文献   

9.
设计并实现利用语音识别对多媒体信息检索的系统。该系统综合运用分类法.主题法和基于内容的多媒体检索方法,并嵌入语音识别技术。以达到综合运用多媒体低级内容特征和高级语义特征来提高检索性能的目的,同时使得人机交互更为便利。  相似文献   

10.
一种语音特征参数子分量分析与有效性评价的新方法   总被引:2,自引:0,他引:2  
语音信号中包含语义和说话人个性两大特征,其有效提取和强化对语音识别和说话人识别有着非常重要的意义。本文提出了一种语音特征参数中语义和个性特征子分量分析与有效性评价的4S方法,对语义和个性特征的成份比例进行分析,并通过量化指标评判特征参数对语音识别和说话人识别的有效性。运用4S分析方法对目前常用的特征参数LPC, LPCC和MFCC的子分量分析与有效性评价结果表明,所有的特征参数都更多地包含了语义特征信息,语义特征和说话人个性特征的成份比例因子LIR分别为1.30、1.44和1.61,并且,三种参数对语音识别和说话人识别的有效性均呈现出依次提高的特性。  相似文献   

11.
钱兆鹏  肖克晶  刘蝉  孙悦 《电子学报》2020,48(5):840-845
电子喉语音存在基频单一、发声机械、辐射噪声大等多种缺陷,这严重影响了电子喉语音可懂度和自然度,特别是对汉语普通话之类的声调语言,问题尤其严重.汉语普通话电子喉语音识别存在辅音混淆的问题并且识别结果没有声调,因此本文在识别结果的基础之上设计了拼音拼写修正器和声调标注工具,再结合基于Tacotron-2的TTS实现了电子喉语音向正常语音的转换.客观评价实验结果表明,拼音拼写修正器可以提高拼音准确率,声调标注在有上下文的语义环境中具有较高准确率.主观听力测试结果表明,本文所提方法在不同语言水平上提高了汉语普通话电子喉语音的可懂度和自然度.研究结果表明,本文设计的方法可以将不带声调的电子喉语音转换为正常语音,相比于传统语音转换方法具有更高的性能.  相似文献   

12.
不良语音识别技术是在高清音视频业务中监测不良信息的有效手段。本文提出了一个基于声学模型的不良语音识别框架。并针对框架中特征提取、声学模型构建、不良语音判定模型三个重要部分的实现方法进行分析描述。并列举了各种方法的优缺点。对构建高效的不良语音识别系统具有较高的参考价值。  相似文献   

13.
李永伟  陶建华  李凯 《信号处理》2023,39(4):632-638
语音情感识别是实现自然人机交互不可缺失的部分,是人工智能的重要组成部分。发音器官的调控引起情感语音声学特征的差异,从而被感知到不同的情感。传统的语音情感识别只是针对语音信号中的声学特征或听觉特征进行情感分类,忽略了声门波和声道等发音特征对情感感知的重要作用。在我们前期工作中,理论分析了声门波和声道形状对感知情感的重要影响,但未将声门波与声道特征用于语音情感识别。因此,本文从语音生成的角度重新探讨了声门波与声道特征对语音情感识别的可能性,提出一种基于源-滤波器模型的声门波和声道特征语音情感识别方法。首先,利用Liljencrants-Fant和Auto-Regressive eXogenous(ARX-LF)模型从语音信号中分离出情感语音的声门波和声道特征;然后,将分离出的声门波和声道特征送入双向门控循环单元(BiGRU)进行情感识别分类任务。在公开的情感数据集IEMOCAP上进行了情感识别验证,实验结果证明了声门波和声道特征可以有效的区分情感,且情感识别性能优于一些传统特征。本文从发音相关的声门波与声道研究语音情感识别,为语音情感识别技术提供了一种新思路。  相似文献   

14.
《信息技术》2017,(11):117-120
针对一些嵌入式设备在特定的工作场景下无法实现语音识别的问题,提出了一种适用于嵌入式平台语音识别的解决方案。采用百度语音云平台提供的语音识别服务,对自然语言进行语音识别,通过搭建交叉编译环境将录音数据进行压缩编码上传到服务器,交叉编译后下载到嵌入式设备中来完成整个识别过程。通过大量实验数据统计分析,该方案的语音识别准确率可达93%。结果表明:该语音识别方案在正常语速输入下,能够满足工作使用要求,具有较高的准确性和鲁棒性。  相似文献   

15.
由于大词汇量连续语音识别技术仍不够成熟,目前市场上仍然没有出现真正的家庭语音智能控制系统。通过对关键词检出技术的特点及系统组成的分析,给出了一种基于采用关键词检出技术的语音识别子系统构建的家庭语音智能控制系统的组建方案。这种方案以较成熟的小词汇量关键词检出技术为基础,把系统处理的对象从孤立词扩展到连续语音,使语音控制系统更加符合人的自然语音习惯,同时避开了语义识别的难题,采用关键词分类,存储发送指令和目标控制器相结合的方法实现对目标的准确控制,并且易于实现。  相似文献   

16.
从语音识别技术、语音合成技术、语义理解技术三个方面分析应用于移动智能终端中的语音交互技术的发展现状,提出当前语音交互技术中存在的一些技术难点,并针对这些技术难点展望了语音交互技术的发展趋势。  相似文献   

17.
《信息技术》2019,(6):91-95
随着中国经济高速发展以及全球一体化的进程,英语成为了人们日常交流必不可少的工具,然而对于初学者来说,能够通过语音识别技术将语音信号转化成文本的格式,更有利于快速掌握英语。而且语音识别技术经过多年的发展依然具有巨大的挖掘潜力,面对移动互联网的快速发展,通过对实时通信工具的大数据量的需求爆发,英语语音识别的实时性和系统稳定性越来越受到关注,文中分析了常用的传统语音识别技术,例如动态时间规整、神经网络模型和隐马尔可夫模型等,运用隐马尔可夫模型对语音信号进行处理和识别,提取出特征参数,与经过训练的模型体系进行匹配,找出最优的识别序列。然后在PC平台上,利用MATLAB建模仿真,基本实现了英语语音短句的识别,对于后续的硬件产品实现打下了良好的基础,具有积极的现实意义。  相似文献   

18.
语音识别技术是让机器通过识别和理解过程把语音信号转变为相应的文本或命令,其识别过程与人对语音识别处理过程基本上是一致的,包括语音特征提取、声学模型与模式匹配(识别算法)、语言模型与语言处理三个部分。  相似文献   

19.
基于Android移动平台开发,结合Google语音识别技术,使用GPRS或WiFi进行移动终端与Google云服务端之间的数据交互,并通过对语音识别结果的处理,最终设计出一个可以语音控制拨号的应用。同时,开发人员还创造性地实现了语音搜索联系人的功能,使用户能够快速查找到手机通讯录中的指定联系人。通过真机测试,语音拨打电话的功能完全实现,性能稳定可靠,实用性强。  相似文献   

20.
语音控制是互联网交互控制方式之一,它可以将人类肢体解放出来,为用户带来了非常大的便利,使得OTT业务更加多彩诱人,也使得互联网业务发生了天翻地覆的变化。随着语音识别、语音合成、语义理解、智能问答、云计算等技术的不断成熟,语音控制互联网交互业务已经进入到了实用化的阶段,并为广大用户所接受。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号