共查询到20条相似文献,搜索用时 15 毫秒
1.
2.
文本检测技术在社会中有着广泛的应用,随着深度学习的加入,文本检测技术得到了进一步的提升。近年来基于深度学习的检测算法逐渐增多,针对场景文本检测的各种问题提出了相应的解决方法,提升了场景文本检测算法的性能。本文对这些算法进行了归纳、分析和总结,将这些算法大致分为基于回归和基于分割两种类型,并对其性能进行了对比,最后基于这些算法的研究内容为文本检测领域未来的发展提出了新的研究方向。 相似文献
3.
4.
针对任意形状的场景文本检测与识别,提出一种新的端到端场景文本检测与识别算法。首先,引入了文本感知模块基于分割思想的检测分支从卷积网络提取的视觉特征中完成场景文本的检测;然后,由基于Transformer视觉模块和Transformer语言模块组成的识别分支对检测结果进行文本特征的编码;最后,由识别分支中的融合门融合编码的文本特征,输出场景文本。在Total-Text、ICDAR2013和ICDAR2015基准数据集上进行的实验结果表明,所提算法在召回率、准确率和F值上均表现出了优秀的性能,且时间效率具有一定的优势。 相似文献
5.
6.
传统中文车牌识别方法对场景约束有要求,算法实时性差,且无法被部署在边缘设备上。针对上述问题,文中提出一种基于YOLO(You Only Look Once)的无约束场景中文车牌检测与识别方法。该方法分为车牌检测和车牌字符识别两个模块。在车牌检测部分,使用改进的YOLOv5模型,在预测目标候选区域的基础上多预测4组关键点用于车牌矫正,并使用在COCO数据集上训练的预训练模型进行训练,减少了由环境复杂引起的误检问题,具有高实时性。在车牌字符识别部分,改进了CRNN(Convolutional Recurrent Neural Network)模型,减少了算法的参数量和计算量,使其能成功部署于各类边缘设备。实验结果表明所提出的车牌识别方法能在复杂环境中高效检测并识别车牌。文中提出的车牌检测模型在车牌检测数据集上的map值相较Retina-face提升了3.0%,车牌字符识别模型在车牌识别数据集上精确度相比LPR-Net提升了4.2%。 相似文献
7.
为了提高行业内对阿拉伯文字字符识别分类的准确率,建立了基于深度学习的阿拉伯文字图像分类方法,对该方法所采用的神经网络分类算法进行研究。首先,在数据集图像的处理方面,不满足于平常的图像预处理方式(翻转、平移等操作),而是利用生成式对抗网络来做数据增强。其次,对于分类网络,加深了卷积神经网络的深度(基于VGG19),使得分类效果更好,根据实验结果可得出所提出的方法在准确率、精确率、召回率和F1值上相比于本课题上以往的机器学习和深度学习识别分类方法提升效果非常显著,其值分别是0.985 7、0.983 2、0.992 4和0.984 0,该算法的提出为少数民族文字高精度识别分类提供了有效方法。 相似文献
8.
针对自然场景中任意形状文本图像因文本行难以区分导致的信息丢失问题,提出了 一种基于深度学习的场景文本检测算法。首先构建特征提取模块,使用Resnet50作为骨干 网络,在增加跨层连接的金字塔网络结构中引入并联的空洞卷积模块,以提取更多语义信息; 其次,对得到的特征图进行多尺度特征融合,学习不同尺度的特征;最后预测出不同内核大 小的文本实例,并通过尺度扩展逐渐扩大文本行区域,直到得到最终的检测结果。实验结果 表明,该方法在SCUT-CTW1500弯曲文本数据集上的准确率、召回率及F1值分别达到88.5%、 77.0%和81.3%,相比其他基于分割的算法,该算 法对弯曲文本的检测效果良好,具有一定的 应用价值。 相似文献
9.
随着大数据技术的发展以及计算机处理能力的增强,深度学习在计算机视觉领域取得了巨大成功,场景识别精度得到了大幅提高.本文对基于混合表示、基于显著性区域和基于多阶段特征融合三类基于深度学习的场景识别方法进行了总结和分析,并在常用数据集上进行了评估,最后对未来的研究方向进行了展望. 相似文献
10.
11.
信息论的经典结果表明,信源信道分离编码是渐进最优的。但现代通信系统对时延、带宽等愈发敏感,分离设计对解码具有无限计算能力这一假设难以成立。带宽有限时,相对于信源信道联合编码,分离编码已被证明是次优的。传统的联合信源信道编码需要复杂的编码方案,相较之下,数据驱动的深度学习技术则带来了新的设计思路。适时地对相关研究成果进行总结,有助于进一步明确深度学习方法解决信源信道联合编码问题的方式,为研究新的研究方向提供依据。首先介绍了基于深度学习的信源压缩方案和端对端收发信机模型,随后分析不同信源类型下的两种联合编码设计思路,最后探讨了基于深度学习的信源信道联合编码的潜在问题和未来的工作方向。 相似文献
12.
13.
随着计算机视觉技术的迅速发展以及人们对于建设智慧城市的渴望,车辆重识别技术取得了不小的突破。它可以助力于搜寻救援、打击犯罪等诸多领域。深度学习及神经网络为该项任务突破传统特征的瓶颈带来了可能,而随着各种大规模数据集的提出,越来越多的学者关注到了此项任务,并成为当下的研究热点。本文对车辆重识别任务的兴起、发展及现状进行了一定的归纳总结,提出了现有技术下的一些不足,并对未来的发展做出了一些思考与预测。 相似文献
14.
15.
手语识别涉及计算机视觉、模式识别、人机交互等领域,具有重要的研究意义与应用价值。深度学习技术的蓬勃发展为更加精准、实时的手语识别带来了新的机遇。该文综述了近年来基于深度学习的手语识别技术,从孤立词与连续语句两个分支展开详细的算法阐述与分析。孤立词识别技术划分为基于卷积神经网络(CNN)、3维卷积神经网络(3D-CNN)和循环神经网络(RNN) 3种架构的方法;连续语句识别所用模型复杂度更高,通常需要辅助某种长时时序建模算法,按其主体结构分为双向长短时记忆网络模型、3维卷积网络模型和混合模型。归纳总结了目前国内外常用手语数据集,探讨了手语识别技术的研究挑战与发展趋势,高精度前提下的鲁棒性和实用化仍有待于推进。
相似文献16.
《电子技术与软件工程》2017,(17)
真实驾驶场景是智能网联汽车开发、测试及相关技术发展的基础条件及关键支撑,可为相关研究的开展提供重要理论依据,而目前,我国有关真实道路场景数据的相关研究比较匮乏。本文首先研究搭建Tensorflow框架用以处理视觉感知任务的深度学习平台,然后基于真实驾驶场景数据,研究智能车辆视觉感知驾驶环境所依赖的核心算法与网络模型,采用卷积神经网络Multi Net实现真实交通环境中行驶车道的分割和目标物的检测。 相似文献
17.
由于人们对美好生活的向往愈发强烈,消费已经成为拉动我国经济发展的重要引擎,而在消费过程中强化消费体验也是提升消费者服务效益的关键所在。为了能够在提升消费体验的同时降低人力的投入,引入智能化商品识别工具,研究一种利用注意力机理进行特征抽取与学习的方法。文章简要介绍了深度学习方法和基于深度学习的商品识别方法,探讨了深度学习多目标商品检测算法,对比分析了改进后的MaskR-CNN,可有效防止因网络复杂性的提高而造成的性能下降,从而提高了检测效率和检测精度。 相似文献
18.
19.
被动声呐通过接收目标自身发出的辐射噪声信号进行目标探测。水声目标识别通过分析水声信号来判别目标个体,是水声工程领域的重点研究方向。深度学习作为近年来各领域的研究热点,其在水声目标识别领域中的应用引起了学者的广泛关注。该文以水声目标识别的步骤框架为切入,介绍了典型深度网络模型;总结出了深度学习在水声目标识别领域中的两大内涵:围绕时频谱、梅尔倒谱系数等特征调研了近几年深度学习作为分类器的关键问题以及研究进展,围绕数据增强、数据降噪等信号处理手段调研了近几年深度学习作为信号处理工具的关键问题以及研究进展;并从数据驱动、特征驱动、模型驱动3个方面对该领域的发展趋势进行展望,旨在推动水声目标识别领域的发展。 相似文献
20.
笔迹性别识别在取证分析中具有重要意义.近年来,虽然笔迹性别识别获得了越来越多的关注,但是目前提出的算法都基于人工设计的特征,难以准确地表达笔迹包含的信息,因而准确率较低.针对这个问题,本文提出了一种基于深度学习的笔迹性别识别方法,使用深度学习caffe工具,将预处理后的笔迹图像输入本文设计的卷积神经网络进行分类.本文首先提取笔迹图像的每个单词,然后取单词的不同全排列拼接成基础图,接着按照固定的大小从基础图截取材料图,最后以材料图为输入数据,以包含7个卷积层的网络为模型进行分类.本文的方法在IAM On-Line公开数据库上进行了测试,取得了较高的识别率. 相似文献