排序方式: 共有138条查询结果,搜索用时 15 毫秒
61.
为了提高声纹识别技术的识别性能,将DenseNet应用于语谱图实现声纹识别,从提高网络的运算效率和增强声纹特征的表征能力2个方面对DenseNet进行优化,提出采用深度可分离卷积来减少网络的参数量,以及增加中心损失函数项来提高声纹特征的表征能力.从训练结果可以看出,通过深度可分离卷积,网络的参数量减少了25.5%,模型... 相似文献
62.
为了克服语音身份确认中语音分割、特征提取和鲁棒性差的困难,文中分析叩齿声音波形特性,提出一种利用叩齿声音进行身份确认的方法。使用二阶微分方程建立齿震动发声的近似模型,以此为基础提出基于叩齿声音信号的身份确认方法。实验结果表明,叩齿声音信号稳定性强,处理复杂度低于声纹信号,应用于身份识别性能优良。该方法和经典的支持向量机、最近邻算法相比,运算量低,所需训练样本少。 相似文献
63.
64.
目前在高速发展的电影市场下,偷漏瞒报票房、影片盗录盗放等乱象屡屡出现,严重扰乱了电影市场秩序,因此加强影厅放映内容的监管需求也更为迫切.本文在此背景上将声纹识别技术在电影放映领域进行探索实验,通过在影片播放过程中采集声音样本,并根据Landmark算法构造声纹特征进行匹配,最终达到识别放映内容的结果,为影院放映监测机制提供有效思路.本实验已基本实现该功能并具有较高识别率,但在后期仍需在算法优化改进中做进一步探索. 相似文献
65.
电网调度下令操作对于电网运行方式和人员安全具有重要意义。当前的下令环节主要依靠调度电话或网络发令形式,缺乏人员验证与防误,存在一定的安全隐患。声纹识别技术作为一种非接触式生物验证方法中,有助于提高调度下令环节的安全性。本文通过对比声纹识别技术中的全变量系统和卷积神经网络模型, 得出卷积神经网络模型可以深刻挖掘语音频谱中的声纹信息,识别效果更好。采用基于卷积神经网络的声纹识别技术,构建了调度下令验证系统。通过验证实验,可以看该系统对于人员的识别度高达95.42%,同时克服了传统方案需要全变量建模的缺陷,降低了系统复杂度,具有抗噪性。该系统可帮助远程识别现场的接令人员与调度下令人员的真实身份,提高了调度运行的安全性与效率,具有实际应用价值。 相似文献
66.
语音是一种重要的信息资源传递与交流方式,人们经常使用语音作为交流信息的媒介,在语音的声学信号中包含大量的说话者信息、语义信息和丰富的情感信息,因此形成了解决语音学任务的3个不同方向,即声纹识别(Speaker Recognition,SR)、语音识别(Auto Speech Recognition,ASR)和情感识别(Speech Emotion Recognition,SER),3个任务均在各自的领域使用不同的技术与特定的方法进行信息提取与模型设计。文中首先综述了3个任务在国内外早期的发展历史路线,将语音任务的发展归纳为4个不同阶段,同时总结了3个语音学任务在特征提取时所采用的公共语音学特征,并针对每类特征的侧重点进行了说明。然后,随着近年来深度学习技术在各个领域中的广泛应用,语音任务也得到了很好的发展,文中针对目前流行的深度学习模型在声学建模中的应用分别进行了分析,按照有监督、无监督的方式总结了针对3种不同语音任务的声学特征提取方式及技术路线,还总结了基于多通道并融合注意力机制的模型,用于语音的特征提取。为了同时完成语音识别、声纹识别和情感识别任务,针对声学信号的个性化特征提出了一个基于多任务的Tandem模型;此外,提出了一个多通道协作网络模型,利用这种设计思路可以提升多任务特征提取的准确度。 相似文献
67.
提出一种新型声纹识别系统的设计方案.有别于传统声纹识别系统的是,该识别系统的预处理部分使用言语过滤的方法,特征提取过程采用情感补偿的办法.其中,言语过滤以语音识别为技术支持,可以剔除嘈杂背景,限制冒名顶替,排除语音赝本等等;情感补偿以语音情感计算为理论基础,能够很好地解决声音漂移、伪装模仿等同题.基于这两部分提取特征数据将更加准确有效. 相似文献
68.
在传统Mel倒谱系数提取过程的基础上,结合离散小波变换,提出了改良动态Mel倒谱系数及基于小波改良的Mel倒谱系数,给出了相应的算法。不同语音长度和信噪比实验表明,该算法使得系统识别率和鲁棒性得到了提高。 相似文献
69.
语音是人类最重要的交流方式之一。语音信号中除了文本内容外,还包含了说话人的身份、种族、年龄、性别和情感等丰富的信息,其中说话人身份的识别也被称为声纹识别,是一种生物特征识别技术。声纹具有获取方便、容易保存、使用简单等特点,而深度学习技术的进步也极大地促进了识别准确率的提升,因此,声纹识别已被应用于智慧金融、智能家居、语音助手和司法调查等领域。另一方面,针对深度学习模型的对抗样本攻击受到了广泛关注,在输入信号中添加不可感知的微小扰动即可导致模型预测结果错误。对抗样本的出现对基于深度学习的声纹识别也将造成巨大的安全威胁。现有声纹对抗样本防御方法会不同程度地影响正常样本的识别,并且局限于特定的攻击方法或识别模型,鲁棒性较差。为了使对抗防御能够兼顾纠正错误输出和准确识别正常样本两个方面,本文提出一种“破坏+重建”的两阶段对抗样本防御方法。第一阶段,在对抗样本中添加具有一定信噪比幅度限制的高斯白噪声,破坏对抗扰动的结构进而消除样本的对抗性。第二阶段,利用提出的名为SCAT-Wave-U-Net的语音增强模型重建原始语音样本,通过在Wave-U-Net模型结构中引入Transformer全局多头自注意力和层间交叉注意力机制,使改进后的模型更有助于防御声纹对抗样本攻击。实验表明,提出的防御方法不依赖于特定声纹识别系统和对抗样本攻击方式,在两种典型的声纹识别系统下对多种类型对抗样本攻击的防御效果均优于其他预处理防御方法。 相似文献
70.
变压器声纹信号包含大量反映内部机械状态的有效信息。为实现变压器内部机械状态不停电检测,提出一种基于特征筛选和改进深度森林的变压器机械状态声纹识别方法。首先,利用自适应噪声完备集合经验模态分解(CEEMDAN)声纹信号得到本征模态函数(IMF),并通过频谱分析和皮尔逊相关系数对IMF分量进行筛选,得到包含故障信息的IMF分量。其次,利用各IMF分量在频段上的分布情况进行高、低频段划分,依据高、低频段IMF分量的差异性,将高频段IMF分量的时频能量和低频段IMF分量的幅值特性作为特征指标,构成特征向量,输入改进后的深度森林模型,得到10种机械松动状态的声纹识别结果。最后,通过现场试验验证了该方法的有效性。研究结果表明:所提方法对10种机械松动状态的平均识别准确率达99.2%。与传统变压器声纹特征相比,所提声纹特征区分度更高;与传统识别模型相比,所提改进深度森林识别模型复杂度更低,训练速度更快,识别准确率更高。 相似文献