期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

李泽孙颖张雪英周雅茹《北京邮电大学学报》2023,(5):87-92+105

现有情感识别模型的构建大多数是针对语音单模态进行的，容易产生歧义，且忽略了连续情感与离散情感的相互关系。为了解决这些问题，提出了元双模态学习(MBL)模型，利用单模态连续情感(效价度、激活度和控制度)辅助双模态离散情感识别。在特征融合方面，采用了跨模态注意力机制，有效地解决了模态序列数据需要对齐的问题。同时，在辅助任务训练过程中，通过多任务学习中的硬参数共享方式，实现了连续情感和离散情感的三维信息交互。将每个说话人的语句作为小样本，使学习模型适应不同说话人，从而具有更好的泛化能力。在交互式情绪二元运动捕捉数据库的脚本和对话两组数据集上，用MBL模型进行情感识别，准确率分别为71.24%和69.12%,表明其具有良好的性能。相似文献

2.

二次判决的融合系统在说话人识别中的应用

宁向延景昊《武汉大学学报(工学版)》2011,44(4):534-537

用希尔伯特-黄变换(HHT)对语音信号进行处理,由此提取语音特征参数.针对单一说话人识别方法的局限性,基于VQ分类器的工作原理,以缩小类集合规模为出发点,结合信息融合理论提出了基于串联方式的二次判决融合系统.实验表明,该融合系统较独立MFCC(Mel Frequency Cepstrum Coefficient)判决系统有更好的识别效果. 相似文献

3.

手形和掌纹决策层融合方法研究

王科俊宋新景王晨晖《黑龙江水专学报》2010,1(4):122-127

手形识别和掌纹识别是两种不同的生物特征识别技术,根据二者的特点,将它们相结合研究手形和掌纹融合算法。分别介绍了基于几何特征的手形特征提取方法和基于模糊方向能量的掌纹特征提取方法,针对两种生物特征的特点,重点研究了二者在决策层融合的方法,构建基于并联融合和串联融合的双模态识别系统。通过对每种算法的实验测试,表明融合后的系统性能要优于单一的手形识别和掌纹识别方法的性能。相似文献

4.

脸耳多模态稀疏表示融合识别方法比较

黄增喜于春李明欣《西华大学学报(自然科学版)》2016,35(4):17-22, 29

将稀疏表示应用于脸耳多模态身份辨识,比较和分析采用不同融合方法的多模态稀疏表示识别算法的准确性和鲁棒性,为多模态稀疏表示融合识别算法设计提供理论和方法指导。结合多模态融合层次理论与稀疏表示分类的技术特点,提出3种多模态稀疏表示识别方法:直接特征融合法、间接特征融合法和匹配层融合法。从多模态融合角度看,3种方法的不同在于融合层次或融合策略不同;从稀疏表示角度看,它们的主要区别在于稀疏表示时脸和耳特征耦合的程度不同。在3个多模态数据库上的实验结果表明:所提3种方法在识别准确率和鲁棒性上远优于采用NN、NFL和SVM等分类器的融合识别方法;当脸耳图像中噪声不显著时, 3种方法性能相当,当噪声严重时,匹配层融合识别方法优于特征层融合方法。相似文献

5.

基于Sugeno测度的动态不可加双矢量量化说话人识别研究

田景峰赵振东胡喜梅《华北电力大学学报(自然科学版)》2010,37(6)

针对双矢量量化方法中语音的静态特征和动态特征的权重不满足可加性的情况,提出了一种新的说话人识别方法——基于Sugeno测度的动态不可加双矢量量化说话人识别方法。该方法在Sugeno测度空间上将说话人语音的静态特征和动态特征用Sugeno测度进行动态融合。然后,在噪声环境下研究了该方法的识别效果,找到了噪声环境下语音的静态特征和动态特征参数的较优的权重组合。实验结果表明,与双矢量量化识别方法相比,该方法可以使识别率明显提高。该方法为研究各类语音特征参数之间的关系、探寻最优的特征匹配方案提供了一种新的途径。相似文献

6.

基于深度学习的多模态情感识别综述

《西安邮电学院学报》2022,(1)

简要介绍了文本、语音和人脸等3种单模态情感识别方法,总结了常用的多模态情感数据集。通过分析基于深度学习的多模态情感识别的研究现状,按照融合方式将基于深度学习的多模态情感识别分为基于早期融合、晚期融合、混合融合以及多核融合等4种情感识别方法,并进行了对比分析。最后,指出了情感识别技术研究进展存在的问题及未来发展趋势。相似文献

7.

说话人识别技术及其在工厂自动控制系统中的应用

覃爱娜韩华《电力科学与技术学报》2003,18(2):68-70

说话人识别是以话音对说话人进行区分,从而进行身份鉴别与认证的技术.介绍了在工厂自动控制系统中说话人识别技术的应用,包含其原理、所采用的识别方法及其系统实现. 相似文献

8.

双模压缩叠加相干态的非经典性质

刘玉洁黄艳庞绍芳《大连轻工业学院学报》2006,25(1):55-59

本文描述辐射场的一类新的非经典态,称之为双模压缩叠加相干态,其定义式为：｜ψ〉＝CS（ξ）（｜α1,α2〉＋eiφ｜α1＊,α2＊〉）. 通过它的归一化常数的计算,讨论其非经典性质,即压缩效应、亚泊松分布、光子反聚束效应以及两模间二阶相关函数.数值计算结果表明,双模压缩叠加相干态具有更为显著的非经典性质,只要我们适当地选择参数α1,α2,ψ,θ和ξ,双模压缩叠加相干态就可以约化成双模压缩叠加真空态和双模叠加相干态,因此双模压缩叠加相干态是更广泛的一类非经典光场态. 相似文献

9.

基于子带处理多分类器融合的说话人识别

崔国辉田岚《山东大学学报(工学版)》2004,34(4):108-111

提出了一种基于子带处理多分类器融合的说话人识别方法 .宽带语音信号通过Mel滤波器组转变为多个子带信号 ,对各子带数据独立分析提取相应的特征参数 ,进而对每个子带分别建立识别模型进行判决 ,最后利用分类器融合规则 ,给出总体判决 .研究表明 ,该方法在子带数目选为 16时可以得到最好的识别效果 ,并且在有窄带噪声的情况下 ,子带多分类器融合法比宽带语音数据建模表现出更好的鲁棒性 . 相似文献

10.

基于矢量量化改进算法的说话人识别 总被引：2，自引：0，他引：2

陆小珊田岚《山东大学学报(工学版)》2004,34(3):60-62

给出一种采用LPCCEP特征参数和改进矢量量化的数字音说话人识别方法 ,该方法适于说话人集合适中(10 0人以内 )情况 ,具有训练简单、存储数据量少、响应快等特点 .为提高系统的识别率和可靠性 ,系统采用了方差修正的VQ改进算法 ,使建立的说话人模型考虑了说话人帧特征概率分布的更精细结构 .实验结果表明 ,改进后的方法对提高系统的识别率效果明显相似文献