首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
基于深度学习的行人重识别研究进展   总被引:7,自引:0,他引:7  
罗浩  姜伟  范星  张思朋 《自动化学报》2019,45(11):2032-2049
行人重识别是计算机视觉领域近年来非常热的一个研究课题,可以被视为图像检索的一个子问题,其目标是给定一个监控行人图像检索跨设备下的该行人图像.传统的方法依赖手工特征,不能适应数据量很大的复杂环境.近年来随着深度学习的发展,大量基于深度学习的行人重识别方法被提出.本文先简单介绍了该问题的定义及传统方法的局限,并列举了一些适用于深度学习方法的行人重识别数据集.此外我们详细地总结了一些比较典型的基于深度学习的行人重识别方法,并比较了部分算法在Market1501数据集上的性能表现.最后我们对该问题未来的研究方向做了一个展望.  相似文献   

2.
《微型机与应用》2018,(4):74-78
TensorFlow是谷歌开源的机器学习及深度学习框架,具有高度的灵活性,可以运行在多种平台上,如CPU、GPU以及移动设备,支持当前流行的深度学习模型。卷积神经网络具有多个处理层,能对图像的特征进行逐层抽象,相比于传统的图像识别方法具有良好的效果,对输入图像的旋转、扭曲、变形具有良好的鲁棒性,并且不用对图像进行预处理,简化了图像识别的步骤。在TensorFlow平台上,搭建了一个卷积神经网络模型,利用MNIST数据集对模型进行训练及测试,最终测试能达到99%的识别率。  相似文献   

3.
基于深度学习的电池片缺陷识别研究   总被引:2,自引:2,他引:2  
基于TensorFlow框架搭建卷积神经网络对电池片电致发光图像进行缺陷识别。选取公开的数据集,其中包含了电池片的不同种类缺陷。在传统的VGGNet网络的基础上使用全卷积神经网络进行训练,并分析不同损失函数和dropout概率在数据集上的训练效果。经过实验证明,该算法实现了对电池片是否有缺陷的准确识别。研究还得出压缩网络结构对算法训练速率能有大幅提升,这使得简化的模型更具有可迁移性,为大范围的实时缺陷识别提供了一种有效方案。  相似文献   

4.
5.
人工智能的发展给人们的日常生活以及社会发展带来了极大的便利,无人超市的出现要求对目标识别进行深入研究.该系统采用深度学习理论以及TensorFlow学习框架来实现水果识别.利用卷积神经网络训练数据集,得出各类水果的代表性特征,从而准确进行水果识别.  相似文献   

6.
随着桥梁基础设施建设逐年发展,桥梁裂缝的检测愈发重要。近年来,卷积神经网络的出现能够弥补传统检测方法的缺陷,大大提高了工作效率。针对以上问题,分析并搭建了基于深度学习的桥梁裂缝识别系统。通过清洗数据、调整参数、提高图片分类识别的准确率、降低损失函数,最终准确率达到96%以上。  相似文献   

7.
8.
字符型验证码作为常见的验证码类型,被广泛应用在各种网络平台,作为一种防止自动化脚本入侵的信息安全手段.针对这种验证码识别问题提出了一种基于卷积神经网络来识别字符型图片验证码的方法.采用TensorFlow深度学习框架对卷积神经网络模型进行训练,将灰度化的验证码图像作为输入,通过验证码数据集进行实验.结果表明,该模型对识别字符型验证码具有较好的泛化能力与鲁棒性.  相似文献   

9.
10.
随着人工智能的发展,场景识别作为计算机视觉研究的重要方向之一,吸引着越来越多研究者的关注.由于传统的手工特征无法充分描述场景图像的信息导致效果不理想,而卷积神经网络(CNN)提取的特征能够包含丰富的场景语义和结构信息,因此就常见的体系结构而言,本文选取AlexNet网络模型进行场景识别的研究,分别从网络模型的深度、宽度、多尺度化提取以及多层融合考虑进行改进,改进后在两个数据集上的识别率分别可达92.0%和94.5%,通过对比结果表明了本文方法的有效性.  相似文献   

11.
为解决因手写书法作品种类繁多而识别困难的问题,降低人们观赏书法的门槛,本文提出了基于深度学习的手写书法字体识别算法.识别过程中首先使用投影法等图像处理方法对书法作品图像中的汉字进行定位和分割,然后分别利用GoogLeNet Inception-v3模型和ResNet-50残差网络进行书体风格识别和字形识别.实验结果表明...  相似文献   

12.
随着深度学习技术在计算机视觉领域的发展,场景文本检测与文字识别技术也有了突破性的进展.受到自然场景下极端光照、遮挡、模糊、多方向多尺度等情况的影响,无约束的场景文本检测与识别仍然面临着巨大的挑战.从深度学习的角度对场景文本检测和文字识别技术进行深入研究,总结出在文本检测技术中将基于分割的方法与回归的方法优势相结合,可以...  相似文献   

13.
人体动作识别是视频理解领域的重要课题之一,在视频监控、人机交互、运动分析、视频信息检索等方面有着广泛的应用.根据骨干网络的特点,从2D卷积神经网络、3D卷积神经网络、时空分解网络三个角度介绍了动作识别领域的最新研究成果,并对三类方法的优缺点进行了定性的分析和比较.然后,从场景相关和时间相关两方面,全面归纳了常用的动作视...  相似文献   

14.
李文英  曹斌  曹春水  黄永祯 《自动化学报》2018,44(11):2023-2030
考古出土的青铜器铭文是非常宝贵的文字材料,准确、快速地了解其释义和字形演变源流对考古学、历史学和语言学研究均有重要意义.青铜器铭文的辨识需要综合文字的形、音、义进行研究,其中第一步也是最重要的一步就是分析文字的形体特征.本文提出一种基于两阶段特征映射的神经网络模型来提取每个文字的形体特征,最后对比目前已知的文字研究成果,如《古文字类编》、《说文解字》,得出识别的结果.通过定性和定量的实验分析,我们发现本文提出的方法可达到较高的识别精度.特别地,在前10个预测类别中(Top-10)准确率达到了94.2%,大幅缩小了考古研究者的搜索推测空间,提高了青铜铭文识别的效率和准确性.  相似文献   

15.
基于深度学习的人体行为识别算法综述   总被引:10,自引:0,他引:10  
人体行为识别和深度学习理论是智能视频分析领域的研究热点, 近年来得到了学术界及工程界的广泛重视, 是智能视频分析与理解、视频监控、人机交互等诸多领域的理论基础. 近年来, 被广泛关注的深度学习算法已经被成功运用于语音识别、图形识别等各个领域.深度学习理论在静态图像特征提取上取得了卓著成就, 并逐步推广至具有时间序列的视频行为识别研究中. 本文在回顾了基于时空兴趣点等传统行为识别方法的基础上, 对近年来提出的基于不同深度学习框架的人体行为识别新进展进行了逐一介绍和总结分析; 包括卷积神经网络(Convolution neural network, CNN)、独立子空间分析(Independent subspace analysis, ISA)、限制玻尔兹曼机(Restricted Boltzmann machine, RBM)以及递归神经网络(Recurrent neural network, RNN)及其在行为识别中的模型建立, 对模型性能、成果进展及各类方法的优缺点进行了分析和总结.  相似文献   

16.
中文命名实体识别(CNER)任务是问答系统、机器翻译、信息抽取等自然语言应用的基础底层任务。传统的CNER系统借助人工设计的领域词典和语法规则,取得了不错的实验效果,但存在泛化能力弱、鲁棒性差、维护难等缺点。近年来兴起的深度学习技术通过端到端的方式自动提取文本特征,弥补了上述不足。该文对基于深度学习的中文命名实体识别任务最新研究进展进行了综述,先介绍中文命名实体识别任务的概念、应用现状和难点,接着简要介绍中文命名实体识别任务的常用数据集和评估方法,并按照主要网络架构对中文命名实体识别任务上的深度学习模型进行分类和梳理,最后对这一任务的未来研究方向进行了展望。  相似文献   

17.
本文以计算机显示设备泄漏电磁信号为研究对象,对于人工提取特征识别电磁泄漏信号存在的主观性强、特征冗余的问题,区别于传统基于经验的人工特征提取模式,利用人工智能深度学习方法,使用处理图像的深度学习技术应用于电磁信息泄漏特征识别,提出了一种基于卷积神经网络的识别方法.该方法首先提取电磁泄漏信号的时频谱信息作为卷积神经网络模...  相似文献   

18.
随着交通的发展,桥梁在运输过程中扮演着越来越重要的角色,桥梁也更加多样化。因此面对大量工况不同的桥梁,发展一种能便捷学习新工况的智能化裂缝检测技术显得尤为重要。为提高目标检测算法的准确率和效率,本文将裂缝原始图像切分成3种不同分辨率和尺寸的切片,训练网络识别不同尺寸的裂缝。同时为了增加算法的后续拓展性,设计一种根据训练集标注尺寸自适应调整锚框的手段,让算法在后续使用过程中针对不同工程情况需要增加训练数据时,能直接添加数据进行训练,自动调整最佳锚框尺寸,使该算法在实际使用中具有学习改进的空间。与原始YOLOv3网络和文献中的算法对比,本文算法的精确度平均达到91%以上且扩展性更好。  相似文献   

19.
针对现有基于深度学习的三维模型识别方法缺乏结合三维模型的上下文细粒度局部特征,可能造成几何形状极其相似,局部细节信息略有不同的类识别混淆的问题,提出一种基于深度图注意力卷积神经网络的三维模型识别方法。首先,通过引入邻域选择机制挖掘三维模型的细粒度局部特征。其次,通过空间上下文编码机制捕捉多尺度空间上下文信息,且与细粒度局部特征相互补偿以增强特征的完备性。最后,采用一种多头部机制,使图注意力卷积层聚合多个单头部的特征以增强特征的丰富性。此外,设计选择性丢弃算法,根据度量权重值对神经元重要性进行排序,智能地丢弃重要性较低的神经元来防止网络过拟合。算法在ModelNet40数据集上的三维模型识别准确率达到了92.6%,且网络复杂度较低,在三维模型识别准确率和网络复杂度之间达到最佳平衡,优于当前主流方法。  相似文献   

20.
二维人脸识别受光照、遮挡和姿态的影响较大.为了克服二维人脸识别的缺点,本文提出了一种基于深度学习的多模态融合三维人脸识别算法.该方法首先使用卷积自编码器将彩色图像和深度图进行融合,将融合后的图像作为网络的输入进行预训练,并且设计了一种新的损失函数cluster loss,结合Softmax损失,预训练了一个精度非常高的模型.之后使用迁移学习将预训练的模型进行微调,得到了一个轻量级神经网络模型.将原始数据集进行一系列处理,使用处理之后的数据集作为测试集,测试的识别准确率为96.37%.实验证明,该方法弥补了二维人脸识别的一些缺点,受光照和遮挡的影响非常小,并且相对于使用高精度三维人脸图像的三维人脸识别,本文提出的算法速度快,并且鲁棒性高.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号