首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到11条相似文献,搜索用时 62 毫秒
1.
在检测出音位属性的基础上,提出了一种基于音位属性后验概率的音素边界检测算法,并将音位属性与边界信息应用于基于条件随机场的音素识别.该方法首先计算得出相邻帧音位属性后验概率向量间的夹角,然后将夹角的极大值点所在的帧选为侯选边界,最后通过约束条件去除极值点中的错误边界.本文将音素边界与音位属性信息进行组合,作为基于条件随机场模型的识别系统的观测特征,实验结果表明,增加边界信息后,音素正确识别率有了显著提升.  相似文献   

2.
孟莎  余鹏  刘加 《自动化学报》2010,36(2):215-220
对汉语自然对话语音索引问题进行了研究. 比较了不同单元格的识别和检索性能, 提出不同单元格的转换方法、格间的融合方法以及格内节点与边的合并方法. 格转换实现了识别单元和索引单元的分离, 词格转换得到的无调音节格将品质因数(Figure of merit, FOM)从基线系统的69.2%提高到73.7%; 格间融合综合利用多个格的信息, 将FOM进一步提高到78.6%; 格内合并对格进行了有效的压缩, 使其可应用于海量语音检索.  相似文献   

3.
传统的语音文档分类系统通常是基于语音识别系统所转录的文本实现的,识别错误会严重影响到这类系统的性能。尽管将语音和识别文本融合可以一定程度上减轻识别错误的影响,但大多数融合都是在表示向量层面融合,没有充分利用语音声学和语义信息之间的互补性。本文提出融合声学特征和深度特征的神经网络语音文档分类,在神经网络训练中,首先采用训练好的声学模型为每个语音文档提取包含语义信息的深度特征,然后将语音文档的声学特征和深度特征通过门控机制逐帧进行融合,融合后的特征用于语音文档分类。在语音新闻播报语料集上进行实验,本文提出的系统明显优于基于语音和文本融合的语音文档分类系统,最终的分类准确率达到97.27%。  相似文献   

4.
一种精确检测语音端点的方法   总被引:1,自引:0,他引:1  
端点检测是语音识别中的一项关键技术,端点检测的准确性对语音识别的性能有很大影响,特别是对端点检测比较敏感的语音识别算法。本文引用窗长动态变化的端点检测技术,并将传统的双门限端点检测算法和窗长动态改变的端点检测技术结合起来用于语音端点检测。大量实验表明这种技术可以比较精确的检测语音端点,特别是地检测语音的起始端点中有很大的优势。使用改进后的语音端点检测技术,可以有效地提高语音识别率。  相似文献   

5.
陶剑文  赵杰煜 《计算机应用》2008,28(6):1566-1569
LPI对于局部流形结构是优化的, 但在时空上运行效率较低,使其很难应用于大型数据集。基于LPI算法,提出了一种优化的LPI算法FLPI,它将LPI问题分解为一个图嵌入问题和一个正则最小二乘问题,避免了稠密矩阵的特征值分解,显著减少了计算复杂度。此外,在监督环境下,利用一个特别设计的图,使FLPI只需要解决正则最小二乘问题,进一步减少了时空开销。实时数据集实验结果显示,FLPI获得了相似或优于LPI的结果,且运行速度明显提升。  相似文献   

6.
一种语音端点检测方法的探究   总被引:16,自引:0,他引:16  
刘庆升  徐霄鹏  黄文浩 《计算机工程》2003,29(3):120-121,138
研究了一种以过零率ZCR和能量E为特征的语音端点检测方法。在进行大量实验的基础上,经过分析,对该方法提出了几点改进。  相似文献   

7.
一种改进的检测语音端点的方法   总被引:8,自引:9,他引:8  
在语音识别系统中产生错误识别的原因之一是端点检测有误差。针对短时过零率对噪声的存在非常敏感,本文引入一种判决门限,修正了传统过零率的计算。同时引入窗长动态改变的端点检测方法,并将两者有机的融合到传统的双门限端点检测算法中。试验表明这种算法可以比较精确的检测出语音端点,适合于对端点检测比较敏感的语音识别算法。使用改进后的语音端点检测方法,可以有效地提高语音识别率。  相似文献   

8.
识别率和对环境的适应能力是一个语音识别系统的两个重要性能,常见的提高语音识别率的方法大多通过改进声音模型来获得较高的识别率,这往往造成声音模型的复杂化以及模型训练的困难。另外,在说话人和麦克风位置不固定等情况下,这些方法识别效果往往很差。文中提出了一种用多话筒分别识别一个语音,并用数据融合技术对识别结果进行处理的语音识别方法。初步的实验结果表明该方法不仅可以提高系统对环境的适应能力,而且在单个声音  相似文献   

9.
许友亮  张连海  屈丹  牛铜 《计算机工程》2012,38(11):160-162,166
提出一种基于长时性信息的音位属性检测方法,该方法通过高、低两层时间延迟神经网络(TDNN)进行实现,低层TDNN在短时特征上进行音位属性的检测,高层TDNN在低层检测结果的基础上,对更长时段上的信息进行融合。实验结果表明,引入长时性特征使得音位属性检测率提升约3%,将音位属性后验概率作为音素识别系统的观测特征,使用长时性特征的识别结果提升约1.7%。  相似文献   

10.
随着大数据时代的到来,各种音频、视频文件日益增多,如何高效地定位关键敏感信息具有非常重要的研究意义。目前研究人员对针对英语和汉语的语音检索技术进行了深入的研究,而针对维吾尔语的语音检索技术还处于起步阶段。该文对维吾尔语语音关键词检索技术进行了研究并采用了大词汇量连续语音识别、利用聚类算法将多候选词图转换为混淆网络、倒排索引、置信度以及相关度的计算等技术和方法,对维吾尔语语音检索系统进行了研究与搭建。最后在测试集上对该系统进行测试,测试结果显示,在语音识别正确率为82.1%的情况下,检索系统的召回率分别达到97.0%和79.1%时,虚警率分别为13.5%和8.5%。  相似文献   

11.
汉语语音检索的集外词问题与两阶段检索方法   总被引:2,自引:0,他引:2  
该文针对大规模汉语语音检索任务提出汉语语音检索中的集外词问题和针对集外查询词的两阶段检索方法。汉语语音识别和检索中,集外词可以以词表词序列的形式被识别和检索到,因此被认为不存在集外词问题;该文发现集外查询词性能远远低于集内查询词,将此问题定义为汉语语音检索任务的集外词问题,并提出两阶段的检索方法,第一阶段通过模糊音素匹配的方法提高查全率,第二阶段通过词格修正的方法提高查准率。实验表明,两阶段的检索方法极大的提高了典型集外查询词的检索性能,FOM指标相对基线系统提高了24.1%。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号