首页 | 官方网站   微博 | 高级检索  
     

复杂背景下的手势识别
引用本文:王银,陈云龙,孙前来. 复杂背景下的手势识别[J]. 中国图象图形学报, 2021, 26(4): 815-827
作者姓名:王银  陈云龙  孙前来
作者单位:太原科技大学电子信息工程学院, 太原 030024;先进控制与装备智能化山西省重点实验室, 太原 030024
基金项目:国家自然科学基金项目(61905172);山西省科技成果转化引导专项项目(201904D131023);山西省重点研发计划项目(201803D121025,201903D121130);山西省研究生教育创新项目(2020SY422)
摘    要:目的 手势识别是人机交互领域的热点问题。针对传统手势识别方法在复杂背景下识别率低,以及现有基于深度学习的手势识别方法检测时间长等问题,提出了一种基于改进TinyYOLOv3算法的手势识别方法。方法 对TinyYOLOv3主干网络重新进行设计,增加网络层数,从而确保网络提取到更丰富的语义信息。使用深度可分离卷积代替传统卷积,并对不同网络层的特征进行融合,在保证识别准确率的同时,减小网络模型的大小。采用CIoU(complete intersection over union)损失对原始的边界框坐标预测损失进行改进,将通道注意力模块融合到特征提取网络中,提高了定位精度和识别准确率。使用数据增强方法避免训练过拟合,并通过超参数优化和先验框聚类等方法加快网络收敛速度。结果 改进后的网络识别准确率达到99.1%,网络模型大小为27.6 MB,相比原网络(TinyYOLOv3)准确率提升了8.5%,网络模型降低了5.6 MB,相比于YOLO(you only look once)v3和SSD(single shot multibox detector)300算法,准确率略有降低,但网络模型分别减小到原来的1/8和1/3左右,相比于YOLO-lite和MobileNet-SSD等轻量级网络,准确率分别提升61.12%和3.11%。同时在自制的复杂背景下的手势数据集对改进后的网络模型进行验证,准确率达到97.3%,充分证明了本文算法的可行性。结论 本文提出的改进Tiny-YOLOv3手势识别方法,对于复杂背景下的手势具有较高的识别准确率,同时在检测速度和模型大小方面都优于其他算法,可以较好地满足在嵌入式设备中的使用要求。

关 键 词:手势识别  TinyYOLOv3  深度可分离卷积  CIoU损失
收稿时间:2020-06-16
修稿时间:2020-09-16

Hand gesture recognition in complex background
Wang Yin,Chen Yunlong,Sun Qianlai. Hand gesture recognition in complex background[J]. Journal of Image and Graphics, 2021, 26(4): 815-827
Authors:Wang Yin  Chen Yunlong  Sun Qianlai
Affiliation:College of Electronic Information Engineering, Taiyuan University of Science and Technology, Taiyuan 030024, China;Shanxi Key Laboratory of Advanced Control and Equipment Intelligence, Taiyuan 030024, China
Abstract:
Keywords:gesture recognition  TinyYOLOv3  depthwise separable convolution  CIoU loss
点击此处可从《中国图象图形学报》浏览原始摘要信息
点击此处可从《中国图象图形学报》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号