首页 | 官方网站   微博 | 高级检索  
     

基于伪三维卷积神经网络的手势姿态估计
引用本文:张宏源,袁家政,刘宏哲,原春锋,王雪峤,邓智方.基于伪三维卷积神经网络的手势姿态估计[J].计算机应用研究,2020,37(4):1230-1233,1243.
作者姓名:张宏源  袁家政  刘宏哲  原春锋  王雪峤  邓智方
作者单位:北京联合大学 北京市信息服务工程重点实验室,北京 100101;北京开放大学,北京 100081;中国科学院自动化研究所 模式识别国家重点实验室,北京 100190
基金项目:国家自然科学基金;研究生项目;北京成像技术高精尖创新中心项目;北京市教委科技一般项目
摘    要:大多数现有的基于深度学习的手势姿态估计方法都使用标准三维卷积神经网络提取三维特征,估计手部关节坐标。该方法提取的特征缺乏手部的多尺度信息,限制了手势姿态估计的精度。另外,由于三维卷积神经网络巨大的计算成本和内存需求,这些方法常难以满足实时性要求。为了克服这些缺点,提出以空间滤波器和深度滤波器级联的方式模拟三维卷积,减少网络参数量。同时,在各个尺度上提取手势姿态特征并加以整合,充分利用手势的三维信息。实验表明,该方法能有效提高手势姿态估计精度,减小模型尺寸,且在具有单块GPU的计算机上能以超过119 fps的速度运行。

关 键 词:手势姿态估计  伪三维卷积神经网络  三维特征  深度图像  深度学习
收稿时间:2018/9/2 0:00:00
修稿时间:2020/3/2 0:00:00

Hand pose estimation using pseudo-3D convolutional neural network
ZHANG Hong-yuan,YUAN Jia-zheng,LIU Hong-zhe,YUAN Chun-feng,WANG Xue-qiao and DENG Zhi-fang.Hand pose estimation using pseudo-3D convolutional neural network[J].Application Research of Computers,2020,37(4):1230-1233,1243.
Authors:ZHANG Hong-yuan  YUAN Jia-zheng  LIU Hong-zhe  YUAN Chun-feng  WANG Xue-qiao and DENG Zhi-fang
Affiliation:Beijing Key Laboratory of Information Service Engineering,Beijing Union University,,,,,
Abstract:Most of the existing deep learning-based methods for hand pose estimation use a standard three-dimension convolutional neural network(3D-CNN) to extract 3D features and estimate the 3D coordinates of hand joints. The features extracted by these methods lack the multi-scale information of the hand, which limits the accuracy of hand pose estimation. In addition, due to the huge computational cost and memory requirements of the 3D CNN, these methods are often difficult to meet the real-time requirement. To overcome these weaknesses, the proposed method used a spatial filter and a depth filter to simulate 3D convolutions, which reduced the amount of parameters. It extracted and integrates features at various scales, making full use of the 3D information of hand pose. Experiments show that this method can improve estimation accuracy, reduce model size, and run at over 119 fps on a standard computer with a single GPU.
Keywords:hand pose estimation  pseudo-3D convolutional neural network  3D features  depth image  deep learning
本文献已被 万方数据 等数据库收录!
点击此处可从《计算机应用研究》浏览原始摘要信息
点击此处可从《计算机应用研究》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号