共查询到11条相似文献,搜索用时 62 毫秒
1.
2.
3.
传统的语音文档分类系统通常是基于语音识别系统所转录的文本实现的,识别错误会严重影响到这类系统的性能。尽管将语音和识别文本融合可以一定程度上减轻识别错误的影响,但大多数融合都是在表示向量层面融合,没有充分利用语音声学和语义信息之间的互补性。本文提出融合声学特征和深度特征的神经网络语音文档分类,在神经网络训练中,首先采用训练好的声学模型为每个语音文档提取包含语义信息的深度特征,然后将语音文档的声学特征和深度特征通过门控机制逐帧进行融合,融合后的特征用于语音文档分类。在语音新闻播报语料集上进行实验,本文提出的系统明显优于基于语音和文本融合的语音文档分类系统,最终的分类准确率达到97.27%。 相似文献
4.
一种精确检测语音端点的方法 总被引:1,自引:0,他引:1
端点检测是语音识别中的一项关键技术,端点检测的准确性对语音识别的性能有很大影响,特别是对端点检测比较敏感的语音识别算法。本文引用窗长动态变化的端点检测技术,并将传统的双门限端点检测算法和窗长动态改变的端点检测技术结合起来用于语音端点检测。大量实验表明这种技术可以比较精确的检测语音端点,特别是地检测语音的起始端点中有很大的优势。使用改进后的语音端点检测技术,可以有效地提高语音识别率。 相似文献
5.
LPI对于局部流形结构是优化的, 但在时空上运行效率较低,使其很难应用于大型数据集。基于LPI算法,提出了一种优化的LPI算法FLPI,它将LPI问题分解为一个图嵌入问题和一个正则最小二乘问题,避免了稠密矩阵的特征值分解,显著减少了计算复杂度。此外,在监督环境下,利用一个特别设计的图,使FLPI只需要解决正则最小二乘问题,进一步减少了时空开销。实时数据集实验结果显示,FLPI获得了相似或优于LPI的结果,且运行速度明显提升。 相似文献
6.
7.
一种改进的检测语音端点的方法 总被引:8,自引:9,他引:8
在语音识别系统中产生错误识别的原因之一是端点检测有误差。针对短时过零率对噪声的存在非常敏感,本文引入一种判决门限,修正了传统过零率的计算。同时引入窗长动态改变的端点检测方法,并将两者有机的融合到传统的双门限端点检测算法中。试验表明这种算法可以比较精确的检测出语音端点,适合于对端点检测比较敏感的语音识别算法。使用改进后的语音端点检测方法,可以有效地提高语音识别率。 相似文献
8.
识别率和对环境的适应能力是一个语音识别系统的两个重要性能,常见的提高语音识别率的方法大多通过改进声音模型来获得较高的识别率,这往往造成声音模型的复杂化以及模型训练的困难。另外,在说话人和麦克风位置不固定等情况下,这些方法识别效果往往很差。文中提出了一种用多话筒分别识别一个语音,并用数据融合技术对识别结果进行处理的语音识别方法。初步的实验结果表明该方法不仅可以提高系统对环境的适应能力,而且在单个声音 相似文献
9.
10.
随着大数据时代的到来,各种音频、视频文件日益增多,如何高效地定位关键敏感信息具有非常重要的研究意义。目前研究人员对针对英语和汉语的语音检索技术进行了深入的研究,而针对维吾尔语的语音检索技术还处于起步阶段。该文对维吾尔语语音关键词检索技术进行了研究并采用了大词汇量连续语音识别、利用聚类算法将多候选词图转换为混淆网络、倒排索引、置信度以及相关度的计算等技术和方法,对维吾尔语语音检索系统进行了研究与搭建。最后在测试集上对该系统进行测试,测试结果显示,在语音识别正确率为82.1%的情况下,检索系统的召回率分别达到97.0%和79.1%时,虚警率分别为13.5%和8.5%。 相似文献
11.
汉语语音检索的集外词问题与两阶段检索方法 总被引:2,自引:0,他引:2
该文针对大规模汉语语音检索任务提出汉语语音检索中的集外词问题和针对集外查询词的两阶段检索方法。汉语语音识别和检索中,集外词可以以词表词序列的形式被识别和检索到,因此被认为不存在集外词问题;该文发现集外查询词性能远远低于集内查询词,将此问题定义为汉语语音检索任务的集外词问题,并提出两阶段的检索方法,第一阶段通过模糊音素匹配的方法提高查全率,第二阶段通过词格修正的方法提高查准率。实验表明,两阶段的检索方法极大的提高了典型集外查询词的检索性能,FOM指标相对基线系统提高了24.1%。 相似文献