首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 641 毫秒
1.
莲花山数据集采用与或图作为视觉知识模型,实现对客观世界中视觉模式的多层次表达,从而将多种标注任务统一到图像语法模型框架下。配套数据库通过两层模型分别管理视觉模型与标注数据,提供了灵活方便的数据导入、管理、查阅、输出功能,这是其他数据集所不具备的。最后给出基于该数据集标注结果的内容检索实验,该算法加入到标注工具中,作为一种自动功能用于辅助加速人工标注过程。  相似文献   

2.
医疗文本数据是推行智慧医疗的重要数据基础,而医疗文本为半结构或非结构化数据,难以对其直接进行应用。对医疗文本中所包含的实体及实体关系进行标注是文本结构化的重要手段,也是命名实体识别、关系自动抽取研究的基础。传统的人工标注方法费力费时,已难以适应大数据发展的需求。该文以构建中文医学知识图谱的任务为驱动,构建了半自动化实体及关系标注平台。该平台融合多种算法,能够实现文本预标注、进度控制、质量把控和数据分析等多种功能。利用该平台,进行了医学知识图谱中实体和关系标注,结果表明该平台能够在文本资源建设中控制标注过程,保证标注质量,提高标注效率。同时该平台也被应用于其他文本标注任务,表明该平台具有较好的任务移植性。  相似文献   

3.
对于程序功能场景的识别一直是程序理解方面的难点之一,现有的方法主要还是依靠人工标注。针对该难点,对移动应用的执行过程进行研究,提出一种基于模型的功能场景自动化标注方法 AFSLM。基于交互流建模语言IFML国际标准构造刻画移动应用执行特征的应用执行路径ARP动态模型,用于直接对应移动应用的测试脚本,设计用于度量功能场景相似度的模型匹配算法,提出基于模型的功能场景自动化标注方法 AFSLM,实现将人工测试模型的功能场景标签泛化到自动化工具探索模型上,实现高效的功能场景自动化标注。通过实例研究和实验评估,展示方法的有效性。  相似文献   

4.
数据标注是对未处理的初级数据,包括文本、图像、视频等非结构化数据进行打标签处理,并转换为人工智能可识别的过程。在信息化时代军事舆情领域的数据资源迎来爆发式增长的背景下,数据标注在实现数据标准化与快速准确检索目标数据的场景中扮演着极其重要的角色。为了能够帮助使用人员大幅度提高军事舆情数据的检索与分析效率,主要研究了基于机器学习与深度学习的智能标注技术,对智能标注系统做了流程设计和功能模块架构设计,包括通过Python算子训练实现标注算法模型化、Kubernetes容器编排实现标注算法服务容器化,设计实现了一套以工作流为执行单元、以分发各阶段任务为推动模式的智能标注系统。  相似文献   

5.
工程图样的尺寸标注是CAD支撑软件中的重要组成部分,尺寸标注的方便程度直接反映了CAD系统软件的水平。虽然计算机辅助尺寸标注的研究开展较早,但在智能化、自动化方面与工业界的要求相比,仍然存在较大的差距,影响了计算机绘图和CAD的推广应用。鉴于尺寸标注在CAD系统中的重要性,国内外许多专家学者进行了不断的研究。但由于问题固有的复杂性,一直未见重大突破。目前所见的尺寸标注均采用一种半自动式的标注程序,即给出尺寸类型、尺寸定位点(基准)和标注位置,计算机自动标注。例如:对于一个线尺寸标注,它的操作步骤是:In…  相似文献   

6.
针对智能交通系统(ITS)涉及到的机动车视频处理技术,提出了一种新颖的城市机动车视频标注规范,并开发了一个城市机动车视频标注平台。该平台可辅助用户对机动车视频进行手工标注。在视频处理算法的测试和训练中,利用标注好的机动车视频样本,能够为算法的训练、测试、改进、优化等提供极大的帮助。  相似文献   

7.
郭海凤 《计算机工程》2012,38(12):211-213
在自动标注系统中,底层特征转换成高层标注的准确度较低。为此,将自动标注系统中的底层视觉特征和社会标注系统中的高级语义相结合,提出一种新的图像语义标注算法——FAC算法。从自动标注系统和flickr网站用户中得到候选标注,利用图像标注推荐策略获取推荐标注,根据WordNet语义词典中的语义关系,精简出最终的标注集合。实验结果表明,与传统的自动标注算法相比,FAC算法的准确度较高。  相似文献   

8.
一个实现多种切分标注算法的系统   总被引:2,自引:0,他引:2  
方华  陆汝占  刘绍明 《计算机工程》2004,30(24):122-124,194
介绍了一个对汉语语料进行切分标注的系统——SEGPOS。该系统采用模块化设计,具有灵活的算法实现、替换机制,并能动态扩展各类数据资源,为开发切分、标注算法,进行多种算法的横向比较研究,提供了一个良好的平台。给出了在SEGPOS上实现的多种切分、标注算法的测试结果和分析。  相似文献   

9.
文章讨论了一个新的参数化尺寸标注系统的实现原理、关键技术和设计方法。该系统在以下几个方面取得明显进展,其一,基于AutoCAD的尺寸标注功能及存储格式,设计了新的通用、完整、可靠的尺寸标注系统,为AutoCAD增添了新的标注功能,使其能够准确地标注国家机械制图标准所规定的尺寸标注模式。其二,归纳了AutoCAD和国家标准的各种尺寸标注模式,借助于模式匹配及其推理,自动标注不同类型的尺寸标注,实现了智能化尺寸标注功能。其三,尺寸标注变量及其约束表达式功能,在参数化模型图的参数编辑、尺寸驱动和尺寸标注图素自动生成方面显示出极大的效率。  相似文献   

10.
篇章分析系统性研究的开展依赖于大规模高质量的标注语料.现有标注语料以纯手工标注和单机辅助标注为主,难以满足标注效率和语料质量的需求.因此,该文提出了一套简洁的语料标注协同流程,并基于此实现了一个汉语篇章宏观结构语料协同标注系统,提供了一种流程简洁、分角色协同合作、自动流程控制、安全可靠的线上标注模式.该系统通过设立标注流程状态、收集标注流程中用户的行为数据和语料库辅助统计等方法,从流程控制角度,优化汉语宏观篇章的标注流程,实现质量管控和数据分析.项目实践表明,该系统有效减少了相关标注人员的工作量,提高了标注效率和标注质量,可为大规模、协同汉语篇章语料标注打下基础.  相似文献   

11.
刘梦迪  陈燕俐  陈蕾 《计算机应用》2016,36(8):2274-2281
现有图像自动标注技术算法可以大致划分为基于语义的标注算法、基于矩阵分解的标注算法、基于概率的标注算法以及基于图学习的标注算法等四大类。介绍了各类别中具有代表性的图像自动标注算法,分析了这些算法的问题模型及其功能特点,并归纳了图像自动标注算法中主要的优化求解方法及算法评价中常用的图像数据集和性能评价指标。最后,指出了图像自动标注技术目前存在的主要问题,并且提出了这些问题的解决思路。分析结果表明,对于图像自动标注技术的研究,可充分利用现有算法的优势互补,或借助多学科交叉的优势,寻找更有效的算法。  相似文献   

12.
SMS-2008标注中文短信息库   总被引:2,自引:0,他引:2  
随着短信息应用的普及,用户、运营商及政府管理部门均迫切需要智能短信处理工具。语料库是研究算法,开发系统,测试性能等必不可少的基础资源。但受到技术、版权保护、隐私权利等种种原因,目前还没有公开的标准短信息语料库。SMS-2008标注短信息库是本项目组在国内外率先建立的多用途中文短信息语料库,它包括原始语料库、预处理语料库、隐私标注语料库、内容标注语料库、错误标注语料库等。该语料库可用于短信语言现象研究、短信分类过滤算法研究、隐私保护算法研究、自动纠错算法研究等。  相似文献   

13.
徐光  郭红 《福建电脑》2006,(8):80-81
提出一个基于视觉本体的视频语义标注算法。该算法利用贝叶斯统计学习和决策理论,通过计算视频关键帧的主要区域与视觉本体中概念的视觉相似性.动态地实现对视频对象的半自动语义标注。实验结果表明,利用该算法进行语义标注效果良好.并具有稳定的性能。  相似文献   

14.
基于日志的协同图像自动标注   总被引:1,自引:0,他引:1  
反馈日志隐含的图像语义信息有助于图像自动标注,但日志数据中存在的噪声、片面性等问题制约了其作用,故提出基于日志的协同图像自动标注算法。根据日志获取的特点,采用增量关联规则挖掘处理日志信息去除其噪声,利用协同滤波思想扩展图像标注词数量,利用WordNet得到标注词间关系,并结合图像底层特征利用混合概率模型实现图像自动标注。在Corel5K和互联网数据集上的实验表明:该算法降低了日志噪声及片面性所带来的影响,提高了图像自动标注效率和质量。  相似文献   

15.
目前深度学习在医学图像分析领域取得的良好表现大多取决于高质量带标注的数据集, 但是医学图像由于其专业性和复杂性, 数据集的标注工作往往需要耗费巨大的成本. 本文针对这一问题设计了一种基于深度主动学习的半自动标注系统, 该系统通过主动学习算法减少训练深度学习标注模型所需的标注样本数量, 训练完成后的标注模型可以用于剩余数据集的标注工作. 系统基于Web应用构建, 无需安装且能跨平台访问, 便于用户完成标注工作.  相似文献   

16.
由于人工标注费时费力,线上社区中的许多特征需求缺乏标注信息,导致这些特征需求不能被有效地检索和管理。针对这种情况,提出一种针对特征需求的自动标注系统,可自动抽取特征需求中的标注词,既可以对没有被手工标注的特征需求进行标注词的补充,也可以对用户新提出的特征需求进行标注词推荐,减少用户手工标注的工作量。根据特征需求的文本特点,提出一种协同相关性模型(CRM)。CRM首先使用协同过滤找出与目标特征需求相似的数据组成集合,基于这个集合使用相关性模型得到最后标注的词,这种方式使得标注效果得到较大提升。基于真实的数据集合的实验结果表明,系统在特征需求自动标注方面的效果有效增强。  相似文献   

17.
描述了一个基于依存关系的语义角色标注系统,该系统把依存关系作为语义角色标注的基本单元。通过手工或自动标注出来的依存关系,构造出依存关系树,并从树上抽取特征。用最大熵模型对句中谓词的语义角色进行识别和分类。为了消除不必要的结构化信息,在预处理阶段,依存关系树经过了Xue的剪枝算法处理。通过特征工程,丰富的特征及其组合被应用于系统。最终使用 CoNLL 2008 shared task提供的数据作为训练、开发和测试集,使用手工标注的依存关系,F1值达到了86.25%;使用MSTParser自动产生的依存关系,F1值达到了81.66%。  相似文献   

18.
汽车车身零件图纸的自动标注方法   总被引:1,自引:0,他引:1  
本文提出了一种汽车零件图纸的自动标注方法,给出根据被标注曲线的曲率与延伸方向确定标注间隔与标注方向的算法。  相似文献   

19.
周铭柯  柯逍  杜明智 《软件学报》2017,28(7):1862-1880
自动图像标注是一个包含众多标签、多样特征的富有挑战性的研究问题,是新一代图像检索与图像理解的关键步骤.针对传统基于浅层机器学习标注算法标注效率低下、难以处理复杂分类任务的问题,本文提出了基于栈式自动编码器(SAE)的自动图像标注算法,提升了标注效率和标注效果.全文主要针对图像标注数据不平衡问题,提出两种解决思路:对于标注模型,我们提出一种增强训练中低频标签的平衡栈式自动编码器(B-SAE),较好地改善了中低频标签的标注效果.并在此模型基础上提出一种分组强化训练B-SAE子模型的鲁棒平衡栈式自动编码器算法(RB-SAE),提升了标注的稳定性,从而保证模型本身具有较强地处理不平衡数据的能力;对于标注过程,我们以未知图像作为出发点,首先构造未知图像的局部均衡数据集,并判定该图像的高低频属性来决定不同的标注过程,局部语义传播算法(SP)标注中低频图像,RB-SAE算法标注高频图像,形成属性判别的标注框架(ADA),保证了标注过程具有较强地应对不平衡数据的能力,从而提升整体图像标注效果.通过在三个公共数据集上进行实验验证,结果表明,本文方法在许多指标上相比以往方法均有较大提高.  相似文献   

20.
基于包装器的Deep Web自动语义标注   总被引:3,自引:1,他引:2       下载免费PDF全文
为最准最全地对页面抽取的数据进行语义标注,提出一种基于包装器自动语义标注的方法。该方法利用多个标注源进行组合标注,有效解决单标注源标注率不高问题,同时针对标注不完全问题,给出利用多个数据源的互补关系来标注,生成高效率的标注包装器对抽取结果自动标注。实验结果证明,该方法具有较高的准确性和效率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号