排序方式: 共有44条查询结果,搜索用时 15 毫秒
1.
对于基于Gauss混合模型-通用背景模型(Gaussianmixure model-universal background model,GMM-UBM)方法的文本无关说话人识别,当测试语音时长缩短到很短时,识别率会严重下降。为了充分利用文本内容信息,该文提出了一种基于K-top多音素类模型混合(KPCMMM)的建模方法。在音素识别阶段,利用语音识别得到训练语音的音素序列,在说话人识别阶段利用音素序列对每个说话人训练多个音素类模型,测试语音则在最相近的音素类模型上进行打分判决,K是选取的相近音素类数。由于音素类定义的不同,KPCMMM方法分为基于专家知识和数据驱动这两类。实验结果显示选择合适的K值可以得到更好的识别结果。不同的音素类定义方法的比较实验结果显示:当测试语音时长小于2s时,对比GMM-UBM基线系统,该方法的等错误率(EER)相对下降38.60%。 相似文献
2.
郑方品 《中国新技术新产品精选》2011,(9):62-63
介绍锦屏一级水电站大坝左岸砂板岩层边坡锚喷支护(自钻式锚杆和砂浆锚杆试验)。通过两种不同的施工工艺、方法,最终选择最优的施工工艺,以保证边坡稳定,为边坡顺利下挖提供保障。通过锦屏一级电站砂板岩边坡支护施工,为下步同等条件的地质边坡锚喷支护提供参考依据。 相似文献
3.
本文将视点聚焦在河南省南阳市的岳家村,在城市针灸的的理论基础上,结合当今互联网高速发展的社会背景,对空心村问题进行一定程度的修正。随着中国城镇化进程的推行,城乡结构发生着不可逆的变化,农村人口流入城市,农村结构的非正常化发展也日益引起相关人士的关注,如何还原农村合理的人员构成,唤醒农村原有的活力,成为解决本问题的关键。 相似文献
4.
中国区域农田秸秆露天焚烧排放量的估算 总被引:61,自引:0,他引:61
算了中国区域农田秸秆露天焚烧排放的各种污染物的量. 由于秸秆被大量露天焚烧, 已在中国一些地区引起了严重的环境问题. 根据有关政府部门对2000~2003年全国粮食作物和经济作物产量的县级统计资料, 结合谷草比, 估算的秸秆年产生量约6亿吨/年, 其中水稻、小麦、玉米秸秆共占76%左右. 依据农村生活水平等基础资料, 得到了秸秆被露天焚烧比例的县级数据, 估算出了被焚烧的总量, 约1.4亿吨/年. 结合采用了公开发表文献和试验得到的排放因子, 估算了秸秆露天焚烧PM, SO2, NOx, NH3, CH4, BC, OC, VOC, CO, CO2的排放总量和地区排放量. 其中的一些污染物排放量, 如BC, VOC, OC, CO, CO2, 对全国总排放量的贡献已经非常明显. 以2003年PM的排放为例, 用0.2°×0.2°的网格图显示了排放的地区分布. 结果表明, 排放在地区间的分布极不均衡, 单位面积排放量较高的地区主要来自东部地区、东北地区, 从东北至华东呈带状分布. 最后, 给出了估算排放量的误差分析. 相似文献
5.
为了提高基于G auss混合模型通用背景模型(GMM-U BM)的说话人辨认系统的运算效率,提出一种基于树的核心挑选算法(TBK S),通过将U BM中的各个G auss分布按组织成树形结构,来减少从中挑选核心分布的运算量。实验结果表明:对1 000个说话人进行辨认,TBK S与现有的基于特征矢量重排序的剪枝算法(ORBP)相结合,将基于GMM-U BM的辨认系统的运算速度提高21.9倍,误识率却只上升不到4%;TBK S和ORBP相结合,可大幅度提高GMM-U BM系统的运算效率,而基本不降低识别率。 相似文献
6.
7.
防止假冒者闯入说话人识别系统 总被引:3,自引:0,他引:3
如何防止假冒者闯入,是说话人识别研究中的重要课题之一.回放高保真录音和模仿目标说话人声音是假冒者闯入说话人识别系统的2种常见方式.该文针对用高保真录音来闯入系统进行了初步探索.高保真录音设备是一个模数转换系统,语音通过它会发生一些特性变化.通过检测语音中是否存在高保真录音设备的特性,可以检测假冒者是否在使用回放高保真录音来闯入系统.以Gauss混合模型和通用背景模型(Gaussian mixture model-universal background model,GMM-UBM)说话人识别系统为基础,用语音数据的静音段对信道进行建模,检测待识别语音与训练语音的信道是否相同,进而判断是否属于高保真录音闯入.实验表明,加入了基于静音段的信道检测后,说话人识别系统对含有假冒者闯入的测试数据的等错误率下降了40%左右. 相似文献
8.
针对Mel频率倒谱系数(Mel frequency cepstralcoefficient,MFCC)特征的说话人确认系统在干净语音环境下具有很高识别率但在噪音环境下识别率急剧下降的缺点,构建了基于感知对数面积比系数(perceptual log area ratio,PLAR)特征的说话人确认系统,并对该系统的噪音鲁棒性进行研究。结果表明:PLAR特征具有较强的噪音鲁棒性。将PLAR与MFCC进行特征域和分数域的融合,利用两者之间存在着的互补性,可有效提高说话人确认系统的识别性能。 相似文献
9.
信息咨询口语对话系统中的领域文法规则往往需要专家来人工设计。该文针对一种面向汉语口语的上下文无关增强文法,提出了一种基于句子分割的文法自动推导算法。其基本思想是:用初始规则集对训练例句进行分析,若不能得到完整的语法树,则先对分析结果进行消歧和归一化,然后根据顶层成分递归地推导出缺少的规则,并更新已有的规则集。为了提高最终文法的性能,在例句处理顺序和规则更新上对算法基本流程做了改进。在天气预报查询领域进行了实验,结果文法的句法分析准确率在初始规则集为空时达到了64.8%,在初始规则集只包含日期相关规则时达到了86.4%。 相似文献
10.
提出一种用于哼唱识别精确匹配的线性伸缩动态规划算法。该算法将哼唱旋律切割成句子,对每一句子进行线性伸缩匹配,同时在句子层次进行动态规划获得最优路径。该算法更有效地利用了哼唱语音的分段特性并克服了动态规划在长路径搜索时可能丢失全局最优路径的缺点。在含5 223首M ID I的数据库上同等条件下该算法正确率分别比线性伸缩、动态规划及递归匹配方法提高10.5%、6.0%和2.8%。该算法具有更高的准确率和更小的时间复杂度,是一种更有效的精确匹配算法。 相似文献