基于混合特征提取与跨模态特征预测融合的情感识别模型 |
| |
引用本文: | 李牧,杨宇恒,柯熙政.基于混合特征提取与跨模态特征预测融合的情感识别模型[J].计算机应用,2024(1):86-93. |
| |
作者姓名: | 李牧 杨宇恒 柯熙政 |
| |
作者单位: | 西安理工大学自动化与信息工程学院 |
| |
基金项目: | 西安市科技计划项目(2020KJRC0083)~~; |
| |
摘 要: | 为从多模态情感分析中有效挖掘单模态表征信息,并实现多模态信息充分融合,提出一种基于混合特征与跨模态预测融合的情感识别模型(H-MGFCT)。首先,利用Mel频率倒谱系数(MFCC)和Gammatone频率倒谱系数(GFCC)及其一阶动态特征融合得到混合特征参数提取算法(H-MGFCC),解决了语音情感特征丢失的问题;其次,利用基于注意力权重的跨模态预测模型,筛选出与语音特征相关性更高的文本特征;随后,加入对比学习的跨模态注意力机制模型对相关性高的文本特征和语音模态情感特征进行跨模态信息融合;最后,将含有文本-语音的跨模态信息特征与筛选出的相关性低的文本特征相融合,以起到信息补充的作用。实验结果表明,该模型在公开IEMOCAP(Interactive EMotional dyadic MOtion CAPture)、CMU-MOSI (CMU-Multimodal Opinion Emotion Intensity)、CMU-MOSEI(CMU-Multimodal Opinion Sentiment Emotion Intensity)数据集上与加权决策层融合的语音文本情感识别(DLF...
|
关 键 词: | 特征提取 多模态融合 情感识别 跨模态融合 注意力机制 |
|