排序方式: 共有132条查询结果,搜索用时 15 毫秒
1.
声纹识别利用说话人生物特征的个体差异性,通过声音来识别说话人的身份.声纹具有非接触、易采集、特征稳定等特点,应用领域十分广泛.现有的统计模型方法具有提取特征单一、泛化能力不强等局限性.近年来,随着人工智能深度学习的快速发展,神经网络模型在声纹识别领域崭露头角.文中提出基于长短时记忆(Long Short-Term Memory,LSTM)神经网络的声纹识别方法,使用语谱图提取声纹特征作为模型输入,从而实现文本无关的声纹识别.语谱图能够综合表征语音信号在时间方向上的频率和能量信息,表达的声纹特征更加丰富.LSTM神经网络擅长捕捉时序特征,着重考虑了时间维度上的信息,相比其他神经网络模型,更契合语音数据的特点.文中将LSTM神经网络长期学习的优势与声纹语谱图的时序特征有效结合,实验结果表明,在THCHS-30语音数据集上取得了84.31%的识别正确率.在自然环境下,对于3 s的短语音,该方法的识别正确率达96.67%,与现有的高斯混合模型和卷积神经网络方法相比,所提方法的识别性能更优. 相似文献
2.
传统声纹识别方法过程复杂,模型识别准确率低,是声纹识别应用发展的关键问题。利用深度学习具有自主特征提取及分类的特点,结合卷积神经网络(CNN)和长短期记忆网络(LSTM),提出一种结合的网络模型学习声纹识别特征及对其进行身份认证。将原始语音转换为固定长度语谱图,顺序进入CNN、LSTM,结合网络进行训练以及声纹特征学习。通过对比CNN、LSTM以及DNN网络,验证CNN-LSTM网络在声纹识别中具有较少迭代次数情况下高准确率的特性。经实验结果可以得出,语音空间特征及时序特征均是声纹识别中重要的影响因素,实验中的CNN-LSTM网络模型准确率达到95.42%,损失低值达到0.097 3。该方法有利于实际声纹识别的应用。 相似文献
3.
4.
5.
通过分析掌纹、指纹、虹膜、人脸、步态、声纹等生物特征识别技术的特点以及煤矿现场对入井人员生物特征的影响,指出虹膜识别、人脸识别、步态识别、声纹识别适用于煤矿入井人员唯一性检测;提出了一种基于人员定位和生物特征识别的煤矿入井人员唯一性检测技术方案,将生物特征识别技术嵌入人员定位系统,利用人员定位识别卡实现识别卡数量及人员身份的唯一性检测;指出煤矿入井人员唯一性检测技术的研究关键点是严重污染人脸的识别算法、对设备遮挡情况下人员步态图像的采集及对混入人员语音信号的煤矿现场噪声消除算法。 相似文献
6.
7.
传统的身份认证技术无法对云端的海量访问认证请求进行有效的管理.目前的多因素认证机制中,用户的验证码由云服务提供商支持的多因素认证设备免费生成,而基于专门的动态口令卡的多因素认证服务则需要收取一定的费用.为了实现免费身份认证,采用一种区分性模型方法实现声纹识别说话人身份的确认,并采用信道补偿算法进一步提高系统性能.做了与生成性模型声纹识别身份认证技术进行对比和分析的实验,得到新方法具有鲁棒的身份认证性能的结论. 相似文献
8.
采用模糊C-均值聚类算法(FCM)实现声纹码本的矢量量化,使用基于相似系数和的孤立点检测法识别孤立点.试验表明,该方法能有效地减少孤立点对识别结果的干扰,显著降低码本量化误差,从而提高矢量量化声纹识别系统的识别率. 相似文献
9.
王润舵 《桂林电子科技大学学报》2010,30(6)
人的声音虽然具有个性特征,但随着电子信息技术的迅猛发展,人的语音也可以被模仿.当模仿者模仿说话人声音相似度极高时,当前说话人身份确认系统就有可能会被非法欺骗.研究了一种双模态信息融合的说话人识别方法,能把声纹信息和人脸信息融合在一起,通过动态贝叶斯网络(DBN)方法来刻画两类特征之间的相关性,并根据DBN模型作出最后的说话人识别结果.实验表明,基于双模态信息融合的说话人识别方法比传统单独的声纹识别和人脸识别有较高的正确识别率. 相似文献
10.