期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

周翔宇高仲合《计算机工程与应用》2020,56(9):213-220

为了提升倾斜文本区域定位的准确度,提出了一种基于YOLO算法改进的YOLO_BOX定位模型。设置不同尺寸的anchor对图片进行训练,且定义LOSS损失函数训练预测模型;使用K-means算法对box进行聚类,并利用NMS方法进行多余候选框过滤;利用Angle Correct算法对聚类后的box进行灰度化处理,通过计算像素灰度值的方差来得到文字的倾斜角度并进行角度矫正。实验结果表明,优化后的YOLO_BOX定位模型在ICDAR2015数据集上,对自然场景中倾斜文本区域的定位中具有较高的准确率和召回率。相似文献

2.

基于YOLOv3与MSER的自然场景中文文本检测研究与实现

殷航张智王耀林《计算机应用与软件》2021,38(10):168-172,195

针对在复杂的自然场景中中文本倾斜、模糊、光照等检测难题,提出一种基于卷积神经网络YOLOv3与最大极值稳定区域MSER的检测方法YOLOv3-M,并针对中文场景分别改善YOLOv3与MSER.通过YOLOv3算法对图像文本区域的矩形坐标进行回归预测,设计一个基于MSER的角度检测方法与之关联,实现倾斜文本行的检测.YO... 相似文献

3.

一种自适应的视频帧中字幕检测定位方法 总被引：3，自引：0，他引：3

王勇燕继坤郑辉《计算机应用》2004,24(1):134-135,139

视频帧中的字幕往往包含当前视频的高层语意内容,对视频内容的自动理解、索引和检索有重要意义。文中提出了一种视频帧中字幕的自适应检测定位方法,与以往根据经验设定阈值的方法相比,该方法简单,对视频帧的复杂变化的适应能力更强,检测定位更快速、准确。大量实验结果显示该方法是有效的。相似文献

4.

一种新的基于数据挖掘的入侵检测方法 总被引：3，自引：0，他引：3

卢辉斌徐刚《微处理机》2006,27(4):58-60

提出一种新方法将聚类算法和神经网络相结合用于入侵检测，首先使用聚类算法对数据集进行聚类，聚类后的数据分为确定数据和不确定数据。确定数据用于神经网络的训练，并用于对不确定数据的判决，最后将结果再次训练网络。实验结果表明，此方法有着很好的检测效果。相似文献

5.

一种高效的双边聚类集成算法

杨辉彭晗朱建勇聂飞平《计算机仿真》2021,38(8):328-332,343

谱聚类可以任意形状的数据进行聚类,在聚类集成中能够有效的提高基聚类的质量.以往的聚类集成算法中,聚类集成得到的结果并不是最终聚类结果,还需要利用聚类算法来获得最终聚类结果,在整个过程中会使得解由离散-连续-离散的转变.提出了一种基于谱聚类的双边聚类集成算法.算法首先在生成阶段使用谱聚类算法来获得基聚类,通过标准互信息来选取基聚类.将选出来基聚类和样本作为图的顶点,并对构建的图利用双边聚类算法对基聚类和样本同时聚类直接得到最终聚类结果.在实验中,将所提方法与一些聚类集成算法进行了比较,取得了较好的结果. 相似文献

6.

一种高效异常检测方法 总被引：3，自引：0，他引：3

蒋盛益姜灵敏《计算机工程》2007,33(7):166-168

借鉴万有引力思想提出了一种差异性度量方法和度量类偏离程度的方法,以此为基础提出了一种基于聚类的异常检测方法。该异常检测方法关于数据集大小和属性个数具有近似线性时间复杂度,适合于大规模数据集。理论分析以及在真实数据集上的实验结果表明,该方法是有效的,稳健并且实用。相似文献

7.

一种基于均值漂移的视频场景检测方法

下载免费PDF全文

张玉珍王建宇戴跃伟魏带娣《中国图象图形学报》2010,15(2):314-320

提出了一种高效的视频场景检测方法。首先基于均值漂移,在滑动镜头窗内对各镜头聚类,并获得相应的聚类中心,然后根据电影视频场景的发展模式,计算两个镜头类之间的时序距离,接着基于时空关系进行场景检测,并且由相应的聚类中心获得场景关键帧,最后对场景过分割进行后续处理。实验证实该方法能快速聚类,并且有效地检测出场景和场景关键帧。相似文献

8.

改进PSENet的自然场景文本检测方法

彭栋支世尧李盛达杨鹏《计算机时代》2022,(6):89-92,96

相似文献

9.

基于卷积神经网络的竖排版繁体中文图像文本化研究

李华魏志浩刘俊李万清张林达袁友伟何宏《新电脑》2021,(5):24-30

竖排版繁体中文图像文本化问题可以看作是古籍图像中文字的定位和识别问题,但目前主流的OCR技术对古籍文献中竖排版繁体中文的识别精度不高.为了解决此问题,本文将深度学习应用于文字识别和定位中.首先基于SSD模型,运用目标检测算法从古籍文献图像中定位文字;然后构建了Inception-Resnet卷积神经网络进行文字识别.测... 相似文献

10.

一种快速高效的神经网络分类器

董一鸿《计算机工程》2003,29(19):136-138

提出了一种新型的基于竞争型神经网络的学习算法，该算法综合了竞争型神经网络和层次聚类的特点，通过竞争型神经两络对对象进行初步分类，并在隐含层采用Hcbb学习规则对子类进行关联学习，学习速度快，分类质量好，可以对任意形状、任意大小的簇进行聚类，同时不受噪音的影响，是一种快速高效的分类算法。相似文献

11.

基于神经网络的自然场景方向文本检测器

周铂焱杨鹏《计算机与数字工程》2020,48(1):163-166

场景文本检测是场景文本识别中重要的一步,也是一个具有挑战性的问题。不同于一般的目标检测,场景文本检测的主要挑战在于自然场景图像中的文本具有任意方向,小的尺寸,以及多种宽高比。论文在TextBoxes[8]的基础上进行改进,提出了一个适用于任意方向文本的检测器,命名为OSTD(Oriented Scene Text Detector),可以有效且准确地检测自然场景中任意方向的文本。论文在公共数据集上对提出OSTD的进行评估。所有实验结果都表明,无论在准确性,还是实时性方面OSTD都是极具竞争力的方法。在1024×1024的ICDAR2015 Incidental Text数据集[16]上,OSTD的F-Measure=0.794,FPS=10.7。相似文献

12.

基于生成对抗网络的图像清晰度提升方法

牟森陈洪刚卿粼波何小海王思怡《计算机系统应用》2021,30(2):171-175

视频监控、军事目标识别以及消费型摄影等众多领域对图像清晰度有很高的要求.近年来,深度神经网络在视觉和定量评估的应用研究中取得较大进展,但是其结果一般缺乏图像纹理的细节,边缘过度平滑,给人一种模糊的视觉体验.本文提出了一种基于生成对抗网络的图像清晰度提升方法.为了更好的传递图像的细节信息,采用改进的残差块和跳跃连接作为生成网络的主体架构,生成器损失函数除了对抗损失,还包括内容损失、感知损失和纹理损失.在DIV2K数据集上的实验表明,该方法在提升图像清晰度方面有较好的视觉体验和定量评估. 相似文献

13.

A Character Flow Framework for Multi-Oriented Scene Text Detection

下载免费PDF全文

Wen-Jun Yang Bei-Ji Zou Kai-Wen Li Shu Liu 《计算机科学技术学报》2021,36(3):465-477

Scene text detection plays a significant role in various applications,such as object recognition,document management,and visual navigation.The instance segmentation based method has been mostly used in existing research due to its advantages in dealing with multi-oriented texts.However,a large number of non-text pixels exist in the labels during the model training,leading to text mis-segmentation.In this paper,we propose a novel multi-oriented scene text detection framework,which includes two main modules:character instance segmentation (one instance corresponds to one character),and character flow construction (one character flow corresponds to one word).We use feature pyramid network(FPN) to predict character and non-character instances with arbitrary directions.A joint network of FPN and bidirectional long short-term memory (BLSTM) is developed to explore the context information among isolated characters,which are finally grouped into character flows.Extensive experiments are conducted on ICDAR2013,ICDAR2015,MSRA-TD500 and MLT datasets to demonstrate the effectiveness of our approach.The F-measures are 92.62％,88.02％,83.69％ and 77.81％,respectively. 相似文献

14.

自然场景图像中的中文文本提取

肖珂戴舜姜沫岐《计算机与数字工程》2020,48(1):183-188,193

针对自然场景中中文文本的提取效率不足的问题,提出了一种基于ISODATA聚类和支持向量机(SVM)结合的自然场景中文文本提取算法。根据文本颜色和笔画的特征通过ISODATA聚类算法和局部分割的方法,分割出类文本区域;利用有效的几何特征,通过连通域分析去除部分非文本域;利用中心聚合方法使结构分离的中文文本合并后,将文本连接成行,提出行级特征用SVM分类出正确文本行及相应文本。实验结果表明,该算法对中文文本具有很好的提取效果和综合性能。相似文献

15.

基于深度学习的自然场景文本检测与识别综述

王建新王子亚田萱《软件学报》2020,31(5):1465-1496

自然场景文本检测与识别研究对于从场景中获取信息有重要意义,而深度学习技术有助于提高文本检测与识别的能力.主要对基于深度学习的自然场景文本检测与识别方法和其研究进展进行整理分类、分析和总结.首先论述自然场景文本检测与识别的相关研究背景及主要技术研究路线;然后,根据自然场景文本信息处理的不同阶段,进一步介绍文本检测模型、文本识别模型和端到端的文本识别模型,并阐述和分析每类模型方法的基本思路和优缺点;另外,列举了常见公共标准数据集以及性能评估指标和方法,并对不同模型相关实验结果进行了对比分析;最后总结基于深度学习的自然场景文本检测与识别技术面临的挑战和发展趋势. 相似文献

16.

一种端到端的自然场景文本检测与识别模型

陈鹏李鸣张宇王志鹏《测控技术》2022,41(7):17-22

提出了一种结合卷积神经网络和递归神经网络的有效的端到端场景文本识别方法。首先使用特征金字塔(FPN)提取图像的多尺度特征,然后将引入残差网络(ResNet)的深度双向递归网络(Bi-LSTM)对这些特征进行编码,获得文本序列特征,进而引入注意力机制(Attention)对文本序列特征进行解码达到识别效果。在ICDAR2013、ICDAR2015数据集实验验证了该算法的有效性,该方法不仅降低了训练难度,而且提升了网络的收敛速度,提高了文本识别准确率。该方法的有效性在ICDAR2013、ICDAR2015数据集上得到了充分验证。相似文献

17.

基于深度学习的场景文本检测与识别

宫法明刘芳华李厥瑾宫文娟《计算机系统应用》2021,30(8):179-185

针对复杂场景下文本识别流程复杂繁琐、适应性差、准确度低等缺点,本文提出一种复杂场景下文本检测和识别的新方法.该方法由文本区域检测网络及文本识别网络构成,文本区域检测网络为改进的PSENet,将PSENet的骨干网络改为ResNeXt-101,在特征提取过程中加入可微二值化操作来优化分割网络,不仅简化了后处理,而且提高了... 相似文献

18.

基于边缘检测的卷积核数量确定方法

文元美余霆嵩凌永权《计算机应用研究》2018,35(11)

针对卷积神经网络中卷积核数量多凭经验确定的问题,提出了一种统计图像边缘信息来确定卷积核数量的方法。首先,采用边缘检测算子对训练图像进行边缘检测,并依据卷积层的卷积核尺寸对边缘图像进行边缘块提取;然后,统计提取到的边缘块以获得边缘特征矩阵;最后,计算边缘特征矩阵各列的方差,将方差排序且归一化,选择方差较大部分边缘类型的个数作为卷积核数量。在Mnist和Chars74K数据集上的实验结果表明,本文方法能依数据集特点自适应地确定卷积核数量,构造的卷积神经网络模型大小适应于特定数据集,且能获得较高分类准确率。相似文献

19.

基于双塔结构的场景文字检测模型

下载免费PDF全文

施漪涵仝明磊张魁姚宏扬《计算机工程与应用》2022,58(3):242-248

当图像中文字区域形状复杂多变时,传统锚点方法难以精确定位文字,针对这一问题,提出一种具有双塔结构的文字分割检测算法.在网络中增加自下而上的特征增强路径以充分提炼语义信息,与上一级自上而下的结构形成双金字塔模型;接着新增一条路径缩短较底层与最顶层特征之间的距离,同时使用膨胀卷积,增大卷积核的感受野;在损失函数的设计中引入... 相似文献