排序方式: 共有117条查询结果,搜索用时 976 毫秒
61.
目前的说话人识别系统在噪声环境下性能将急剧下降,为了解决这一问题,提出一种新的基于稀疏编码的说话人识别方法。该方法用一个通用背景字典(Universal Background Dictionary,UBD)刻画说话人语音的共性,并为每个说话人和环境噪声训练相应的字典来刻画说话人和环境的特殊变化。这些字典拼接成一个大字典,然后将待测试语音稀疏分解在这个大字典上以实现说话人识别。为了提高说话人字典的区分能力,通过从说话人字典中移除与通用背景字典原子相似的原子来优化说话人字典。为了跟踪变化的噪声,采用带噪声的语音在线更新噪声字典。在各种噪声条件下的实验表明,所提出的方法在噪声环境下具有较强的鲁棒性。 相似文献
62.
63.
64.
句级(Utterance-level)特征提取是文本无关说话人识别领域中的重要研究方向之一.与只能刻画短时语音特性的帧级(Frame-level)特征相比,句级特征中包含了更丰富的说话人个性信息;且不同时长语音的句级特征均具有固定维度,更便于与大多数常用的模式识别方法相结合.近年来,句级特征提取的研究取得了很大的进展,鉴于其在说话人识别中的重要地位,本文对近期具有代表性的句级特征提取方法与技术进行整理与综述,并分别从前端处理、基于任务分段式与驱动式策略的特征提取方法,以及后端处理等方面进行论述,最后对未来的研究趋势展开探讨与分析. 相似文献
65.
针对经典的向量空间检索模型直接用于基于音节lattice形式的汉语语音检索存在无法有效区分lattice中包含的正确音节识别候选和错误的识别候选以及不能充分利用lattice中所蕴含的各层级信息的不足,提出了一种基于语音文档邻接音节后验概率矩阵的检索方法.该方法以该矩阵作为文档索引,并计算查询请求被包含在语音文档中的后验概率,并以此来度量查询请求和语音文档间的相关度.后验概率作为可靠的置信测度能够有效区分正确和错误的音节候选,在lattice中后验概率的计算能够充分地利用语音识别结果中的多层级的信息.语音检索实验表明,与基于向量空间模型的检索方法相比,该方法的检索性能有显著提高,是一种适用于汉语语音检索的有效方法. 相似文献
66.
67.
本文在DCT最大误差模型研究的基础上提出了一种新的音频水印嵌入位置选择策略。建立了水印嵌入位置和嵌入水印后的音频文件的听觉感知性之阿的关系,根据音频水印的不可听性的要求选择最优的嵌入位置,然后选择不同的水印强度调整鲁棒性,从而最大程度地保持音频水印的不可听性和鲁棒性,为解决音频水印嵌入过程中不可听性和鲁棒性之间的矛盾提供了一种策略。 相似文献
68.
同步信息是实现水印盲检测的一种有效途径,根据人耳听觉系统的后掩蔽效应,将回声信号作为同步信息嵌入到音频载体中,并利用回声信号和原始音频信号之间高度相关特性,将回声同步信号检出,实验表明,除MP3以外的多种攻击形式,该方法具有一定的鲁棒性,在随机插入或删除一些采样点的攻击中,通过检测回声同步信号,可以有效地提高检测水印信号和原始水印信号之间的相似度。 相似文献
69.
70.