首页 | 官方网站   微博 | 高级检索  
     

融合时空图卷积的多人交互行为识别
引用本文:成科扬,吴金霞,王文杉,荣兰,詹永照.融合时空图卷积的多人交互行为识别[J].中国图象图形学报,2021,26(7):1681-1691.
作者姓名:成科扬  吴金霞  王文杉  荣兰  詹永照
作者单位:江苏大学计算机科学与通信工程学院, 镇江 212013;江苏省大数据泛在感知与智能农业应用工程研究中心, 镇江 212013;江苏大学网络空间安全研究院, 镇江 212013;中国电子科学研究院社会安全风险感知与防控大数据 应用国家工程实验室, 北京 100041
基金项目:国家自然科学基金项目(61972183);社会安全风险感知与防控大数据应用国家工程实验室主任基金项目
摘    要:目的 多人交互行为的识别在现实生活中有着广泛应用。现有的关于人类活动分析的研究主要集中在对单人简单行为的视频片段进行分类,而对于理解具有多人之间关系的复杂人类活动的问题还没有得到充分的解决。方法 针对多人交互动作中两人肢体行为的特点,本文提出基于骨架的时空建模方法,将时空建模特征输入到广义图卷积中进行特征学习,通过谱图卷积的高阶快速切比雪夫多项式进行逼近。同时对骨架之间的交互信息进行设计,通过捕获这种额外的交互信息增加动作识别的准确性。为增强时域信息的提取,创新性地将切片循环神经网络(recurrent neural network,RNN)应用于视频动作识别,以捕获整个动作序列依赖性信息。结果 本文在UT-Interaction数据集和SBU数据集上对本文算法进行评估,在UT-Interaction数据集中,与H-LSTCM(hierarchical long short-term concurrent memory)等算法进行了比较,相较于次好算法提高了0.7%,在SBU数据集中,相较于GCNConv(semi-supervised classification with graph convolutional networks)、RotClips+MTCNN(rotating cliips+multi-task convolutional neural netowrk)、SGC(simplifying graph convolutional)等算法分别提升了5.2%、1.03%、1.2%。同时也在SBU数据集中进行了融合实验,分别验证了不同连接与切片RNN的有效性。结论 本文提出的融合时空图卷积的交互识别方法,对于交互类动作的识别具有较高的准确率,普遍适用于对象之间产生互动的行为识别。

关 键 词:动作识别  交互信息  时空建模  图卷积  切片循环神经网络(RNN)
收稿时间:2020/8/23 0:00:00
修稿时间:2020/12/30 0:00:00

Multi-person interaction action recognition based on spatio-temporal graph convolution
Cheng Keyang,Wu Jinxi,Wang Wenshan,Rong Lan,Zhan Yongzhao.Multi-person interaction action recognition based on spatio-temporal graph convolution[J].Journal of Image and Graphics,2021,26(7):1681-1691.
Authors:Cheng Keyang  Wu Jinxi  Wang Wenshan  Rong Lan  Zhan Yongzhao
Affiliation:School of Computer Science and Telecommunications Engineering, Jiangsu University, Zhenjiang 212013, China;Jiangsu Province Big Data Ubiquitous Perception and Intelligent Agricultural Application Engineering Research Center, Zhenjiang 212013, China;Cyber Space Security Academy of Jiangsu University, Zhenjiang 212013, China;National Engineering Laboratory for Public Security Risk Perception and Control by Big Data, China Acadeemy of Electronic Sciences, Beijing 100041, China
Abstract:
Keywords:action recognition  interaction information  spatial-temporal modeling  graph convolution  sliced recurrent neural network(RNN)
点击此处可从《中国图象图形学报》浏览原始摘要信息
点击此处可从《中国图象图形学报》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号