共查询到20条相似文献,搜索用时 0 毫秒
1.
表格广泛存在于科技文献、财务报表、报纸杂志等各类文档中,用于紧凑地存储和展现数据,蕴含着大量有用信息。表格识别是表格信息再利用的基础,具有重要的应用价值,也一直是模式识别领域的研究热点之一。随着深度学习的发展,针对表格识别的新研究和新方法纷纷涌现。然而,由于表格应用场景广泛、样式众多、图像质量参差不齐等因素,表格识别领域仍然存在着大量问题亟需解决。为了更好地总结前人工作,为后续研究提供支持,本文围绕表格区域检测、结构识别和内容识别等3个表格识别子任务,从传统方法、深度学习方法等方面,综述该领域国内外的发展历史和最新进展。梳理了表格识别相关数据集及评测标准,并基于主流数据集和标准,分别对表格区域检测、结构识别、表格信息抽取的典型方法进行了性能比较。然后,对比分析了国内相对于国外,在表格识别方面的研究进展与水平。最后,结合表格识别领域目前面临的主要困难与挑战,对未来的研究趋势和技术发展目标进行了展望。 相似文献
2.
表格文档在日常生活中运用十分广泛,对这类文档进行计算机自动处理能提高文档处理速度和准确度,具有重要的现实意义.表格文档版面结构提取是文档信息处理自动化的核心.由于表格文档图像包含印刷体和手写体字符、图像、污损、噪声和一定的倾斜,在其影响下,正确的提取文档的版面结构是比较困难的.在总结国内外表格文档版面结构提取方法的基础上,提出了一种基于最优坐标系的版面结构提取方法,该方法与其它方法相比具有很强的抗干扰能力和文档版面定义灵活方便的特点. 相似文献
3.
在大数据和互联网的历史背景下,信息技术的发展伴随着大量文档的产生。作为数据关系直观体现的表格常见于文档中,表格的归档也是文档处理的重要任务之一。如何在海量的文档中快速地对表格进行自动化识别成为妨碍文档处理迈向智能化的关键因素。作为人工智能研究领域重要分支之一的表格识别,能实现表格对象和结构的自动化检测与识别,被广泛应用在文档智能化处理等场景。因此总结与综述表格识别领域的概念、技术、应用与挑战显得尤为重要。阐述表格识别的概念,指出表格识别任务可被分为表格检测和表格结构识别两大子任务。针对表格检测研究方向主流的anchor-based和anchor-free算法进行介绍和分析,总结不同算法的优缺点。分别阐述基于语义分割、基于双向割并、融合神经网络以及端到端等四大类别的主流的表格结构识别算法的原理和优缺点。同时分析并讨论目前常见的有机融合表格检测和表格结构识别的非端到端与端到端的表格识别算法。最后总结并指出表格识别的应用、挑战与展望。 相似文献
4.
5.
目的 由于摄像机视角和成像质量的差异,造成行人姿态变化、图像分辨率变化和光照变化等问题的出现,从而导致同一行人在不同监控视频中的外观区别很大,给行人再识别带来很大挑战。为提高行人再识别的识别率,针对行人姿态变化问题,提出一种区域块分割和融合的行人再识别算法。方法 首先根据人体结构分布,将行人图像划分为3个局部区域。然后根据各区域在识别过程中的作用不同,将GOG(Gaussian of Gaussian)特征、LOMO(local maximal occurrence)特征和KCCA(Kernel canonical correlation analysis)特征的不同组合作为各区域特征。接着通过距离测度算法学习对应区域之间的相似度,并通过干扰块剔除算法消除图像中出现的无效干扰块,融合有效区域块的相似度。最后将行人图像对的全局相似度和各局部区域相似度进行融合,实现行人再识别。结果 在4个基准数据集VIPeR、GRID、PRID450S和CUHK01上进行了大量实验,其中Rank1(排名第1的搜索结果即为待查询人的比例)分别为62.85%、30.56%、71.82%和79.03%,Rank5分别为86.17%、51.20%、91.16%和93.60%,识别率均有显著提高,具有实际应用价值。结论 提出的区域块分割和融合方法,能够去除图像中的无用信息和干扰信息,同时保留行人的有效信息并高效利用。该方法在一定程度上能够解决行人姿态变化带来的外观差异问题,大幅度地提升识别率。 相似文献
6.
7.
表格分析是对表格的基本结构及形状进行识别的过程,是以后能否从表格单元中正确提取文本信息的关键.在结合表格特点的基础上,采用了表格线检测与处理相结合的方法获取表格框线.检测表格线过程中,通过定义了主表格线长度来加快扫描的速度:在表格线的处理中,针对杂线的剔除、表格线的调整及最终获得表格结构等方面进行了系统的探讨.大量的实验结果表明所提方法是可行的. 相似文献
8.
9.
提出了一种新型的基于表格线搜索的表格结构提取算法。该算法充分分析了表格的结构特点,应用了大量的先验知识,制定了各种最佳阈值参数的选择规则,对不同的表格适应性很强。测试结果表明,该算法具有抗噪能力强,识别速度快,识别率高等特点,为下一步的表格数据信息提取奠定了基础。 相似文献
10.
11.
本文介绍一种实用的滚屏处理方法,可用于解决纵横尺寸都远超出一屏显示范围的大表格信息的连续输入,修改及显示。 相似文献
12.
提出了一种基于加权运动估计、矢量分割和可变块层次化处理的运动补偿内插(Motion-compensated frame interpolation, MCFI)算法. 首先, 提出一种加权运动估计改善了运动矢量(Motion vector, MV)的准确度, 其次, 通过矢量聚类分割将视频帧分割为运动区域和背景, 然后对运动区域的运动矢量进行了可变块层次化处理. 此过程中, 采用可变块合并算法保证了运动物体的边缘结构信息不被损坏. 同时考虑到部分可变块的多方向性, 使用了自适应矢量中值滤波器和矢量平滑降低了运动块大小, 能有效地消除传统方法中出现的方块效应和重影现象. 实验结果表明该算法在内插图像的主观视觉效果和客观评估标准上都有所提高, 而且对于运动较快及背景较复杂的视频序列同样具有较强的适应性. 相似文献
13.
14.
15.
非限定表格信息提取系统的研究 总被引:3,自引:0,他引:3
本文概要讨论了非限定一表格信息提取系统的结构和技术难点,提出了一种既有利于表格识别,又能进行表格定位的方法-四角定位点法,介绍了利用四角定位点法实现的非限定表格信息提取系统,实验结果表明,该系统具有通用、快速、准确的特点。 相似文献
16.
针对已有网页分割方法都基于文档对象模型实现且实现难度较高的问题,提出了一种采用字符串数据模型实现网页分割的新方法。该方法通过机器学习获取网页标题的特征,利用标题实现网页分割。首先,利用网页行块分布函数和网页标题标签学习得到网页标题特征;然后,基于标题将网页分割成内容块;最后,利用块深度对内容块进行合并,完成网页分割。理论分析与实验结果表明,该方法中的算法具有O(n)的时间复杂度和空间复杂度,该方法对于高校门户、博客日志和资源网站等类型的网页具有较好的分割效果,并且可以用于网页信息管理的多种应用中,具有良好的应用前景。 相似文献
17.
基于块分割和SVM的视频火灾烟雾识别 总被引:2,自引:0,他引:2
研究火灾早期预警问题,为了解决现有图像型火灾烟雾检测算法对环境适应能力不强和探测准确性不高等问题,采用分块和背景差分,分析烟雾在RGB和HSV颜色空间色彩和亮度的变化规律获取疑似烟雾区域;以运动主方向和疑似烟雾与背景对应区域的高低频能量比作为火灾烟雾识别依据,构建SVM分类器,最终实现烟雾判决。并与BP神经网络模型火灾烟雾探测方法进行了比较分析,结果表明,改进的算法具有较强自适应性,识别率高,实时性强,鲁棒性高,可适用于多种火灾探测场景。 相似文献
18.
运用像素水平投影与竖直投影的方法,结合车牌字符的先验信息可以准确地对车牌字符进行切割。同时,针对某些汉字易被错误分割或漏割的情况。对汉字左右边界的起始位置进行标记,利用此标记获得该汉字的原始灰度图像,对其单独进行分割及二值化.避免汉字笔画退化为噪声。实验表明,该方法能够准确分割字符。 相似文献
19.
近几年来,国内外已提出了许多关于表格文件图象分析的方法,但其中关于表格逻辑结构提取物方法却很少,为此,提出了一种关于表格文件逻辑结构撮的方法,此方法主要分为整表的全局划分、局部的逻辑结构分析和整表的再次全局划分3个步骤,该方法强调对文件全局和局部布局结构的综合分析,与以往的仅仅从局部上对表格逻辑结构进行了确定的方法相比,它具有较高的识别正确率,并可以识别结构更为复杂的表格文件。 相似文献
20.
随着网络科技的进步,音频分割技术广泛应用于音频检索、语音识别、语义内容分析等领域,对音频深度处理具有重要意义.使用两种基于BIC准则的音频分割算法进行仿真实验,证明滑动窗口的BIC分割算法在广播新闻语料和访谈性质的电话交谈中,检测到的正确音频分割点数目更多,可取得较好的分割效果. 相似文献