首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 703 毫秒
1.
语音不仅包含说话人所要表达的语义信息,也蕴含着说话人所要表达的情感信息.语音情感识别是人机情感交互的关键,对语音情感的有效识别能够提升语音可懂度,使各种智能设备最大限度理解用户意图,提高机器人性化水平,从而更好地为人类服务.采用文献研究法从语音情感语料库、语音情感特征提取、语音情感模型的构建以及语音情感识别的应用等方面对其研究现状和进展进行了综述;同时,对其未来发展趋势也进行了展望.旨在尽可能全面地对语音情感识别技术进行详细分析,为相关研究人员提供有价值的学术参考.  相似文献   

2.
语音情感识别研究进展综述   总被引:8,自引:2,他引:6  
对语音情感识别的研究现状和进展进行了归纳和总结,对未来语音情感识别技术发展趋势进行了展望. 从5个角度逐步展开进行归纳总结,即情感描述模型、具有代表性的情感语音库、语音情感特征提取、语音情感识别算法研究和语音情感识别技术应用,旨在尽可能全面地对语音情感识别技术进行细致的介绍与分析,为相关研究人员提供有价值的学术参考;最后,立足于研究现状的分析与把握,对当前语音情感识别领域所面临的挑战与发展趋势进行了展望.侧重于对语音情感识别研究的主流方法和前沿进展进行概括、比较和分析.  相似文献   

3.
本文介绍了语音情感识别领域的最新进展和今后的发展方向,特别是介绍了结合实际应用的实用语音情感识别的研究状况。主要内容包括:对情感计算研究领域的历史进行了回顾,探讨了情感计算的实际应用;对语音情感识别的一般方法进行了总结,包括情感建模、情感数据库的建立、情感特征的提取,以及情感识别算法等;结合具体应用领域的需求,对实用语音情感识别方法进行了重点分析和探讨;分析了实用语音情感识别中面临的困难,针对烦躁等实用情感,总结了实用情感语音语料库的建立、特征分析和实用语音情感建模的方法等。最后,对实用语音情感识别研究的未来发展方向进行了展望,分析了今后可能面临的问题和解决的途径。  相似文献   

4.
赵妍妍  陆鑫  赵伟翔  田一间  秦兵 《软件学报》2024,35(3):1377-1402
情感对话技术着眼于对话机器人的“情商”,旨在让对话机器人具有像人类一样观察、理解和表达情感的能力.这项技术可以看作是情感计算和对话技术的交叉,兼顾对话机器人的“智商”和“情商”,从而实现对用户的精神陪伴、情感慰藉和心理疏导.结合对话中情感的特点,对情感对话技术进行全面解析:1)规划对话场景下的情感识别、情感管理、情感表达等3个重要的技术点,并拓展多模态场景下的情感对话技术. 2)介绍情感对话4项关键技术的最新研究进展,并总结这些技术面临的主要挑战和可能解决方案. 3)介绍情感对话技术的数据资源. 4)分析情感对话技术的难点,展望其未来发展方向与前景.  相似文献   

5.
李海峰  陈婧  马琳  薄洪健  徐聪  李洪伟 《软件学报》2020,31(8):2465-2491
情感识别是多学科交叉的研究方向,涉及认知科学、心理学、信号处理、模式识别、人工智能等领域的研究热点,目的是使机器理解人类情感状态,进而实现自然人机交互.本文首先从心理学及认知学角度介绍了语音情感认知研究进展,详细介绍了情感的认知理论、维度理论、脑机制以及基于情感理论的计算模型,旨在为语音情感识别提供科学的情感理论模型.然后,从人工智能角度系统地总结了目前维度情感识别的研究现状和发展,包括语音维度情感数据库、特征提取、识别算法等技术要点.最后,分析了维度情感识别技术目前面临的挑战以及可能的解决思路,对未来研究方向进行了展望.  相似文献   

6.
情感计算的理论与算法研究是近年来人机交互领域的热点话题.当前,常见的情感计算集中在基于面部表情、语音、文本、人体姿态等方向,既有单一模态的算法,又有多模态的综合算法.基于面部表情和语音模态的算法占据多数,国内外基于人体姿态的算法相对较少.文中针对基于姿态的情感计算所面临的几个关键科学问题展开了综述,包括情感的心理学模型、人体姿态估计算法、姿态的情感特征提取算法、情感分类与标注算法、姿态情感数据集、基于姿态的情感识别算法等.具体来说,首先介绍了几种常用的情感计算心理学模型,评述了各类模型的适用场景;随后从人体检测和姿态估计2个角度对人体姿态估计的常用算法进行了总结,并讨论了2D和3D姿态估计的应用前景.针对特征提取算法,分析了基于全身和上半身身体动作的姿态特征提取算法.在情感标注方面,介绍了表演数据和非表演数据的情感标注算法,并指出了半自动或自动的标注非表演数据将是未来的重要发展趋势之一.针对姿态情感数据集,列举了近年来常见的14个数据集,并主要从是否是表演数据、数据维度、静态或动态姿势、全身或非全身数据等几个方面进行了总结.在基于姿态的情感识别算法方面,主要介绍了基于人工神经网络的情感识别算法,指出了不同算法的优劣之处和适用的数据集类型.文中的综述研究,总结提炼了国内外该领域经典且前沿的工作,希望为相关的研究者提供研究帮助.  相似文献   

7.
情感建模与情感识别   总被引:12,自引:2,他引:10  
情感计算是关于、产生于和影响于情感方面的计算,其目的是赋予计算机识别、理解、表达和适应人情感的能力。情感计算通过各种传感器获取由人的情感所引起的表情及生理变化信号,利用“情感模型”对这些信号进行识别,从而理解人的情感并做出适当的响应。该文主要讨论了Picard教授在情感计算中情感识别部分的研究成果,着重分析了面部表情、语音、生理信号的情感模型与情感识别,这是情感计算研究的一个关键问题之一,也是建立和谐人机环境的基础之一。  相似文献   

8.
情感识别研究热点正从单模态转移到多模态。针对多模态情感特征提取与融合的技术难点,本文列举了目前应用较广的多模态情感识别数据库,介绍了面部表情和语音情感这两个模态的特征提取技术,重点阐述了多模态情感融合识别技术,主要对多模态情感特征融合策略和融合方法进行了综述,对不同算法下的识别效果进行了对比。最后,对多模态情感识别研究中存在的问题进行了探讨,并对未来的研究方向进行了展望。  相似文献   

9.
近年来,图像图形技术发展势头强劲,理论创新与技术革新层出不穷,应用范围和领域越来越大,正在引领我们进入更加智能的未来。为了更好地促进图像图形学的发展,中国图象图形学学会建立了学科发展报告制度,每年由中国图象图形学学会咨询与评议工作委员会组织相关专业委员会撰写《图像图形学发展年度报告》,系统分析图像图形学各重要研究方向的发展现状、前沿动态、热点问题和发展趋势,为政府决策和项目立项提供参考和咨询,同时也供图像图形领域的科技工作者们快速了解图像图形学领域的研究进展。为了进一步促进我国图像图形技术的发展和应用、更好地服务图像图形领域的科技工作者,将2021年《图像图形学发展年度报告》修改精简后在《中国图象图形学报》上以此专刊发表。 2021年度的《图像图形学发展年度报告》征文得到了学会各专业委员会的热烈响应。各专业委员会积极组织强大的专家团队,精心选题并撰写了图像图形学各重要研究方向的发展年度报告。经过选题评审、报告评审以及学报复审等严格的同行评审,此次《图像图形学发展年度报告》专刊共收录年度报告15篇,包括视觉理解与计算成像相关的年度报告8篇,数据挖掘与信息交互相关的年度报告7篇。 在视觉理解与计算成像方面:《基于深度学习的视觉目标检测技术综述》介绍了深度目标检测在训练和测试过程中的基本流程,系统地总结和分析了基于单目和双目相机的视觉目标检测方法的国内外研究进展,并展望了视觉目标检测技术的发展与演进方向;《面向复杂场景的人物视觉理解技术》围绕人物视觉理解技术、个体行为分析与群体交互理解、情感的识别和合成等核心关键技术,总结了复杂场景下人物视觉理解领域的研究热点、应用场景及国内外相关研究进展,并展望了该领域的前沿技术与发展趋势;《面向智慧交通的图像处理与边缘计算》从智慧交通系统的发展现状入手,分别围绕面向智慧交通的图像处理与边缘计算技术,阐述了其研究热点与前沿进展,总结比较了国内外的相关学术和产业成果,并对智慧交通系统中的图像处理及边缘计算技术未来的发展进行了总结分析与趋势展望;《视觉弱监督学习研究进展》围绕视觉弱监督学习,以物体检测、语义与实例分割和动作识别等为例综述了国内外研究进展,探讨了各种弱监督形式在实际应用中的可行性,并对其发展方向、应用前景和面临的挑战进行了分析;《智能遥感:AI赋能遥感技术》以遥感数据转化过程中对观测对象的整体观测、分析解译与规律挖掘为主线,通过综合国内外文献和相关报道,梳理了该领域在遥感数据精准处理、遥感数据时空处理与分析、遥感目标要素分类识别、遥感数据关联挖掘以及遥感开源数据集和共享平台等方面的研究现状和进展;《脉冲视觉研究进展》从脉冲视觉模型表达视觉信息的生物学基础和物理原理出发,分析了脉冲视觉原理的软件模拟器及其模拟真实世界光子传播的计算过程,描述了基于脉冲视觉原理的高灵敏光电传感器件及芯片的工作机理和结构设计、基于脉冲视觉的影像重建原理以及脉冲视觉信号与普通图像信号融合的计算摄像算法与计算摄像系统,介绍了基于脉冲神经网络的超高速运动目标检测、跟踪与识别,通过对比国际国内相关研究内容和发展现状,展望了脉冲视觉的发展与演进方向;《计算成像前沿进展》以计算成像的新设计方法、新算法和应用场景为主线,从端到端光学算法联合设计、高动态范围成像、光场成像、光谱成像、无透镜成像、低照度成像、三维成像、计算摄影等研究方向,重点阐述了计算成像领域的发展现状、前沿动态、热点问题和趋势;《移动在线实时绘制技术研究综述》以在线实时绘制技术为切入点,探讨了该技术在移动端、Web端、云端、多端协同四类平台下的发展重心和研究现状,并深度阐述了工业级在线云平台的实施方案。 在数据挖掘与信息交互方面:《表格识别技术研究进展》围绕表格的区域检测、表格结构识别和表格内容识别三个表格识别子任务,从传统方法、深度学习方法等方面,综述了该领域的国内外发展历史和最新进展,同时对未来的趋势和技术发展目标进行了展望;《多媒体隐写研究进展》围绕隐写编码、图像隐写、视频隐写、音频隐写、文本隐写五个方面,系统阐述了隐写术的国内外发展现状,总结了现有隐写技术的局限性以及未来的挑战和发展趋势;《大脑多模态成像技术定量研究进展》围绕定量模型建立、定量参数的测量及成像方法、测量中的影响因素、以及相关技术的应用案例,针对性地总结和讨论了面向人脑微观结构和生理功能指标检测目标的定量成像技术发展现状、存在的关键技术问题和未来的可能发展方向;《多模态人机交互综述》系统综述了多模态人机交互的发展现状和新兴方向,深入梳理了大数据可视化交互、基于声场感知的交互、混合现实实物交互、可穿戴交互和人机对话交互的国内外研究进展;《文化遗产活化关键技术研究进展》基于先进的智能计算、数字媒体、虚拟现实/增强现实技术,结合文化遗产的传播过程和艺术特点,分析和综述了文化遗产收集理解、虚实结合智能展示交互、智慧化平台建设等活化关键技术发展现状、前沿动态、热点问题和发展趋势;《情感计算与理解研究发展概述》全面回顾了多模态情感识别、孤独症情感识别、情感图像内容分析以及面部表情识别等不同情感计算与理解方向在过去几十年的研究进展并对未来的发展趋势进行展望;《跨模态脑图谱数据融合研究进展》分别针对脑影像融合和脑数据融合两类具有代表性的跨模态脑图谱融合技术,阐述和对比了国内外研究发展现状、存在的关键技术问题和未来的发展趋势。 本专刊15篇年度报告内容覆盖度广、对国内外研究现状的总结和发展趋势的分析深入全面、编写规范,集中反映了研究团队的交叉性、研究主题的广泛性和研究成果的前沿性。我们期待广大读者和科技人员通过本期《图像图形学发展年度报告》专刊,能够广泛深入地了解当前图像图形研究领域最新的技术和最前沿的应用方向,在今后的研究工作中更全面地把握国际前沿,更明确地有的放矢,为我国图像图形技术的发展做出新的贡献。  相似文献   

10.
对话情绪识别是情感计算领域的一个热门研究课题,旨在检测对话过程中每个话语的情感类别。其在对话理解和对话生成方面具有重要的研究意义,同时在社交媒体分析、推荐系统、医疗和人机交互等诸多领域具有广泛的实际应用价值。随着深度学习技术的不断创新和发展,对话情绪识别受到学术界和工业界越来越多的关注,现阶段需要综述性的文章对已有研究成果进行总结,以便更好地开展后续工作。从问题定义、问题切入方式、研究方法、主流数据集等多个角度对该领域的研究成果进行全面梳理,回顾和分析了对话情绪识别任务的发展。对话文本中含有丰富的语义信息,结合视频和音频可以进一步提升建模效果,因此,重点对文本对话情绪识别以及多模态对话情绪识别的方法进行了梳理,立足于当前研究现状,总结了现有对话情绪识别领域存在的开放问题以及未来的发展趋势。  相似文献   

11.
近年来,情感计算已经成为自然语言处理与人工智能领域的一个研究热点,而文本情感分析是情感计算的一个重要组成部分.提出了一个基于主题特征与三支决策理论相融合的多标记情感分类方法.首先采用基于主题的情感识别模型判断句子的多标记情感类别,在此基础上结合三支决策理论,最终实现对文本篇章的多标记情感分类.实验结果表明,该方法在文本篇章的多标记情感类别识别上取得了令人满意的结果.  相似文献   

12.
机器的情感是通过融入具有情感能力的智能体实现的,虽然目前在人机交互领域已经有大量研究成果,但有关智能体情感计算方面的研究尚处起步阶段,深入开展这项研究对推动人机交互领域的发展具有重要的科学和应用价值。本文通过检索Scopus数据库选择有代表性的文献,重点关注情感在智能体和用户之间的双向流动,分别从智能体对用户的情绪感知和对用户情绪调节的角度开展分析总结。首先梳理了用户情绪的识别方法,即通过用户的表情、语音、姿态、生理信号和文本信息等多通道信息分析用户的情绪状态,归纳了情绪识别中的一些机器学习方法。其次从用户体验角度分析具有情绪表现力的智能体对用户的影响,总结了智能体的情绪生成和表现技术,指出智能体除了通过表情之外,还可以通过注视、姿态、头部运动和手势等非言语动作来表现情绪。并且梳理了典型的智能体情绪架构,举例说明了强化学习在智能体情绪设计中的作用。同时为了验证模型的准确性,比较了已有的情感评估手段和评价指标。最后指出智能体情感计算急需解决的问题。通过对现有研究的总结,智能体情感计算研究是一个很有前景的研究方向,希望本文能够为深入开展相关研究提供借鉴。  相似文献   

13.
作为人工智能领域的热门研究方向,人脸表情识别(facial expression recognition,FER)是让计算机获取人类感情最直接最有效的方式,在人机交互、智慧医疗、疲劳驾驶等研发课题中占据关键的技术地位。为了满足高识别率的应用需求,FER深度学习网络结构愈发复杂,占用了大量的计算资源和存储空间,严重影响了算法实时性的要求。围绕如何在有效提升模型运算速度的同时,保障模型的精度这一问题展开综述。首先,介绍了利用轻量级网络实现表情识别的重要数据集;其次,对用于人脸表情识别的经典轻量级网络模型进行了分析;再次,阐述了主要的网络轻量化方法的原理、特点及适用场景;最后,总结了轻量级网络在人脸表情识别研究中存在的问题和挑战,对未来的研究方向进行展望。  相似文献   

14.
人脸表情识别综述   总被引:1,自引:0,他引:1  
人脸表情识别作为情感计算的一个研究方向,构成了情感理解的基础,是实现人机交互智能的前提。人脸表情的极度细腻化消耗了大量的计算时间,影响了人机交互的时效性和体验感,所以人脸表情特征提取成为人脸表情识别的重要研究课题。总结了国内外近五年的人脸表情识别的稳固框架和新进展,主要针对人脸表情特征提取和表情分类方法进行了归纳,详细介绍了这两方面的主要算法及改进,并分析比较了各种算法的优势与不足。通过对国内外人脸表情识别应用中实际问题进行研究,给出了人脸表情识别方面仍然存在的挑战及不足。  相似文献   

15.
Automatically recognizing human emotions from spontaneous and non-prototypical real-life data is currently one of the most challenging tasks in the field of affective computing. This article presents our recent advances in assessing dimensional representations of emotion, such as arousal, expectation, power, and valence, in an audiovisual human–computer interaction scenario. Building on previous studies which demonstrate that long-range context modeling tends to increase accuracies of emotion recognition, we propose a fully automatic audiovisual recognition approach based on Long Short-Term Memory (LSTM) modeling of word-level audio and video features. LSTM networks are able to incorporate knowledge about how emotions typically evolve over time so that the inferred emotion estimates are produced under consideration of an optimal amount of context. Extensive evaluations on the Audiovisual Sub-Challenge of the 2011 Audio/Visual Emotion Challenge show how acoustic, linguistic, and visual features contribute to the recognition of different affective dimensions as annotated in the SEMAINE database. We apply the same acoustic features as used in the challenge baseline system whereas visual features are computed via a novel facial movement feature extractor. Comparing our results with the recognition scores of all Audiovisual Sub-Challenge participants, we find that the proposed LSTM-based technique leads to the best average recognition performance that has been reported for this task so far.  相似文献   

16.
在e-Learning环境中,学习普遍存在“情感缺失”问题,该问题会导致学习效果和学习体验下降。在学习过程中及时识别学习者的情感状态是解决“情感缺失”的首要问题,情感识别技术在人机交互教学得到了广泛的应用,但仍然存在不少问题和挑战。随着眼动追踪技术的发展,将眼动信号引入情感识别成为研究的热点。针对当前国内外在e-Learning环境中基于眼动特征的相关研究进行综述,对相关研究中采用的眼动特征、机器学习方法以及涉及的学习过程进行分类、归纳及分析,归纳了五类学习过程研究中常用的眼动特征和识别算法。通过对应用在疲劳检测、健康医疗以及人机交互等相关领域中的眼动特征进行分析,对可借鉴至MOOC学习环境下情感识别的眼动特征进行汇总,并为下一步如何采用眼动特征在MOOC环境下进行情感识别研究提出建议。  相似文献   

17.
情感识别在人机交互中发挥着重要的作用,连续情感识别因其能检测到更广泛更细微的情感而备受关注。在多模态连续情感识别中,针对现有方法获取的时序信息包含较多冗余以及多模态交互信息捕捉不全面的问题,提出基于感知重采样和多模态融合的连续情感识别方法。首先感知重采样模块通过非对称交叉注意力机制去除模态冗余信息,将包含时序关系的关键特征压缩到隐藏向量中,降低后期融合的计算复杂度。其次多模态融合模块通过交叉注意力机制捕捉模态间的互补信息,并利用自注意力机制获取模态内的隐藏信息,使特征信息更丰富全面。在Ulm-TSST和Aff-Wild2数据集上唤醒度和愉悦度的CCC均值分别为63.62%和50.09%,证明了该模型的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号