首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
基于深度学习的场景文字检测综述   总被引:1,自引:0,他引:1  
姜维  张重生  殷绪成 《电子学报》2019,47(5):1152-1161
近年来,基于深度学习的场景文字检测技术取得重要进展.本文综述了该技术在2014~2018年间的最新工作,将其分为传统区域建议方法、文字建议网络方法、基于分割的方法以及文字建议网络与分割的混合方法,并对各类方法的优劣进行分析.本文还展望了未来发展趋势,指出未来研究热点.  相似文献   

2.
文本检测技术在社会中有着广泛的应用,随着深度学习的加入,文本检测技术得到了进一步的提升。近年来基于深度学习的检测算法逐渐增多,针对场景文本检测的各种问题提出了相应的解决方法,提升了场景文本检测算法的性能。本文对这些算法进行了归纳、分析和总结,将这些算法大致分为基于回归和基于分割两种类型,并对其性能进行了对比,最后基于这些算法的研究内容为文本检测领域未来的发展提出了新的研究方向。  相似文献   

3.
深度学习在图像识别的现存模型中,都有检测和识别两个过程,且需借助复杂的网络结构、大量的文本框标注来提高识别准确率.文中针对存在的问题提出了一个简单且鲁棒性强的证件图片无检测文字识别方法,通过嵌入二维特征图中不同序列位置的水平、竖直方向位置编码,将不同子空间的特征表达连接到序列解码器,解码器部分加入了全局上下文模块,网络...  相似文献   

4.
针对任意形状的场景文本检测与识别,提出一种新的端到端场景文本检测与识别算法。首先,引入了文本感知模块基于分割思想的检测分支从卷积网络提取的视觉特征中完成场景文本的检测;然后,由基于Transformer视觉模块和Transformer语言模块组成的识别分支对检测结果进行文本特征的编码;最后,由识别分支中的融合门融合编码的文本特征,输出场景文本。在Total-Text、ICDAR2013和ICDAR2015基准数据集上进行的实验结果表明,所提算法在召回率、准确率和F值上均表现出了优秀的性能,且时间效率具有一定的优势。  相似文献   

5.
6.
传统中文车牌识别方法对场景约束有要求,算法实时性差,且无法被部署在边缘设备上。针对上述问题,文中提出一种基于YOLO(You Only Look Once)的无约束场景中文车牌检测与识别方法。该方法分为车牌检测和车牌字符识别两个模块。在车牌检测部分,使用改进的YOLOv5模型,在预测目标候选区域的基础上多预测4组关键点用于车牌矫正,并使用在COCO数据集上训练的预训练模型进行训练,减少了由环境复杂引起的误检问题,具有高实时性。在车牌字符识别部分,改进了CRNN(Convolutional Recurrent Neural Network)模型,减少了算法的参数量和计算量,使其能成功部署于各类边缘设备。实验结果表明所提出的车牌识别方法能在复杂环境中高效检测并识别车牌。文中提出的车牌检测模型在车牌检测数据集上的map值相较Retina-face提升了3.0%,车牌字符识别模型在车牌识别数据集上精确度相比LPR-Net提升了4.2%。  相似文献   

7.
为了提高行业内对阿拉伯文字字符识别分类的准确率,建立了基于深度学习的阿拉伯文字图像分类方法,对该方法所采用的神经网络分类算法进行研究。首先,在数据集图像的处理方面,不满足于平常的图像预处理方式(翻转、平移等操作),而是利用生成式对抗网络来做数据增强。其次,对于分类网络,加深了卷积神经网络的深度(基于VGG19),使得分类效果更好,根据实验结果可得出所提出的方法在准确率、精确率、召回率和F1值上相比于本课题上以往的机器学习和深度学习识别分类方法提升效果非常显著,其值分别是0.985 7、0.983 2、0.992 4和0.984 0,该算法的提出为少数民族文字高精度识别分类提供了有效方法。  相似文献   

8.
针对自然场景中任意形状文本图像因文本行难以区分导致的信息丢失问题,提出了 一种基于深度学习的场景文本检测算法。首先构建特征提取模块,使用Resnet50作为骨干 网络,在增加跨层连接的金字塔网络结构中引入并联的空洞卷积模块,以提取更多语义信息; 其次,对得到的特征图进行多尺度特征融合,学习不同尺度的特征;最后预测出不同内核大 小的文本实例,并通过尺度扩展逐渐扩大文本行区域,直到得到最终的检测结果。实验结果 表明,该方法在SCUT-CTW1500弯曲文本数据集上的准确率、召回率及F1值分别达到88.5%、 77.0%和81.3%,相比其他基于分割的算法,该算 法对弯曲文本的检测效果良好,具有一定的 应用价值。  相似文献   

9.
随着大数据技术的发展以及计算机处理能力的增强,深度学习在计算机视觉领域取得了巨大成功,场景识别精度得到了大幅提高.本文对基于混合表示、基于显著性区域和基于多阶段特征融合三类基于深度学习的场景识别方法进行了总结和分析,并在常用数据集上进行了评估,最后对未来的研究方向进行了展望.  相似文献   

10.
为改进完善通信辐射源识别课题,引入深度学习作为分类方法。为探究深度学习对辐射源识别的作用,介绍了与通信辐射源识别相关的深度学习理论,从辐射源个体识别与调制方式识别两个方面,对基于深度学习的通信辐射源识别技术的研究现状进行综述,并详细分析了基于深度学习的通信辐射源识别技术的主要难点问题,同时讨论了发展方向和解决方案。  相似文献   

11.
信息论的经典结果表明,信源信道分离编码是渐进最优的。但现代通信系统对时延、带宽等愈发敏感,分离设计对解码具有无限计算能力这一假设难以成立。带宽有限时,相对于信源信道联合编码,分离编码已被证明是次优的。传统的联合信源信道编码需要复杂的编码方案,相较之下,数据驱动的深度学习技术则带来了新的设计思路。适时地对相关研究成果进行总结,有助于进一步明确深度学习方法解决信源信道联合编码问题的方式,为研究新的研究方向提供依据。首先介绍了基于深度学习的信源压缩方案和端对端收发信机模型,随后分析不同信源类型下的两种联合编码设计思路,最后探讨了基于深度学习的信源信道联合编码的潜在问题和未来的工作方向。  相似文献   

12.
《信息技术》2019,(6):77-81
视觉位置识别技术通过将地点图像与数据库中的图像集进行匹配,根据配对图像标签中的位置信息得到定位结果。现有的视觉位置识别网络都是为了应对室外场景而构建和训练的,在室内场景中的识别性能较差。文中提出了一种基于深度学习的室内视觉位置识别卷积神经网络架构,并在室内场景识别数据集上对网络进行了训练,然后在本地室内数据集上对网络参数进行进一步的微调,较好地解决了室内环境中的位置识别问题。和现有的其它视觉位置识别网络相比,文中训练的网络在实际室内环境测试中最大有30%的识别精度提升。  相似文献   

13.
随着计算机视觉技术的迅速发展以及人们对于建设智慧城市的渴望,车辆重识别技术取得了不小的突破。它可以助力于搜寻救援、打击犯罪等诸多领域。深度学习及神经网络为该项任务突破传统特征的瓶颈带来了可能,而随着各种大规模数据集的提出,越来越多的学者关注到了此项任务,并成为当下的研究热点。本文对车辆重识别任务的兴起、发展及现状进行了一定的归纳总结,提出了现有技术下的一些不足,并对未来的发展做出了一些思考与预测。  相似文献   

14.
15.

手语识别涉及计算机视觉、模式识别、人机交互等领域,具有重要的研究意义与应用价值。深度学习技术的蓬勃发展为更加精准、实时的手语识别带来了新的机遇。该文综述了近年来基于深度学习的手语识别技术,从孤立词与连续语句两个分支展开详细的算法阐述与分析。孤立词识别技术划分为基于卷积神经网络(CNN)、3维卷积神经网络(3D-CNN)和循环神经网络(RNN) 3种架构的方法;连续语句识别所用模型复杂度更高,通常需要辅助某种长时时序建模算法,按其主体结构分为双向长短时记忆网络模型、3维卷积网络模型和混合模型。归纳总结了目前国内外常用手语数据集,探讨了手语识别技术的研究挑战与发展趋势,高精度前提下的鲁棒性和实用化仍有待于推进。

  相似文献   

16.
真实驾驶场景是智能网联汽车开发、测试及相关技术发展的基础条件及关键支撑,可为相关研究的开展提供重要理论依据,而目前,我国有关真实道路场景数据的相关研究比较匮乏。本文首先研究搭建Tensorflow框架用以处理视觉感知任务的深度学习平台,然后基于真实驾驶场景数据,研究智能车辆视觉感知驾驶环境所依赖的核心算法与网络模型,采用卷积神经网络Multi Net实现真实交通环境中行驶车道的分割和目标物的检测。  相似文献   

17.
由于人们对美好生活的向往愈发强烈,消费已经成为拉动我国经济发展的重要引擎,而在消费过程中强化消费体验也是提升消费者服务效益的关键所在。为了能够在提升消费体验的同时降低人力的投入,引入智能化商品识别工具,研究一种利用注意力机理进行特征抽取与学习的方法。文章简要介绍了深度学习方法和基于深度学习的商品识别方法,探讨了深度学习多目标商品检测算法,对比分析了改进后的MaskR-CNN,可有效防止因网络复杂性的提高而造成的性能下降,从而提高了检测效率和检测精度。  相似文献   

18.
许超  王仕山 《移动信息》2023,45(7):213-216
如今,越来越多的人使用图像来表示和传递信息,从图像中学习大量信息对人们而言十分便捷,在这个更加强调人机交互效率的信息技术时代,如何快速、准确地识别这些手写数字,成为学术界和科技界关注的问题。对于手写数字的图像识别问题,重点在于如何用数据代表图像,从而表示数据,这里的数据不是像素,而是具有高级表示的图像特征,其提取的结果对识别的准确性非常重要。  相似文献   

19.
被动声呐通过接收目标自身发出的辐射噪声信号进行目标探测。水声目标识别通过分析水声信号来判别目标个体,是水声工程领域的重点研究方向。深度学习作为近年来各领域的研究热点,其在水声目标识别领域中的应用引起了学者的广泛关注。该文以水声目标识别的步骤框架为切入,介绍了典型深度网络模型;总结出了深度学习在水声目标识别领域中的两大内涵:围绕时频谱、梅尔倒谱系数等特征调研了近几年深度学习作为分类器的关键问题以及研究进展,围绕数据增强、数据降噪等信号处理手段调研了近几年深度学习作为信号处理工具的关键问题以及研究进展;并从数据驱动、特征驱动、模型驱动3个方面对该领域的发展趋势进行展望,旨在推动水声目标识别领域的发展。  相似文献   

20.
笔迹性别识别在取证分析中具有重要意义.近年来,虽然笔迹性别识别获得了越来越多的关注,但是目前提出的算法都基于人工设计的特征,难以准确地表达笔迹包含的信息,因而准确率较低.针对这个问题,本文提出了一种基于深度学习的笔迹性别识别方法,使用深度学习caffe工具,将预处理后的笔迹图像输入本文设计的卷积神经网络进行分类.本文首先提取笔迹图像的每个单词,然后取单词的不同全排列拼接成基础图,接着按照固定的大小从基础图截取材料图,最后以材料图为输入数据,以包含7个卷积层的网络为模型进行分类.本文的方法在IAM On-Line公开数据库上进行了测试,取得了较高的识别率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号