首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 352 毫秒
1.
针对目前文档级别关系抽取主要关注实体间的逻辑推理,未充分利用实体间的层次语义信息问题,提出一种基于实体层次结构的文档级别关系抽取模型。考虑多句文本中实体间的交互,将实体构建为文档图并使用图卷积神经进行信息传播;通过实体间的上下位关联构建实体层次树,使用注意力机制将层次语义信息融入实体;为降低模型对实体表面信息的关注,使用实体类型对实体词进行替换。实验结果表明,在大规模文档级别关系抽取数据集上实体语义信息增强的方案能够有效提高文档级别关系抽取的效果。  相似文献   

2.
XML文档的相似测度和结构索引研究   总被引:20,自引:0,他引:20  
郑仕辉  周傲英  张龙 《计算机学报》2003,26(9):1116-1122
提出了一个可用于定量度量XML文档间差异的方法(称为XED距离)。利用结点间的模拟关系,一个XML文档可以表示为一棵精简的、带权重的结构索引树,两个XML文档间的相似度可以通过计算它们的索引树间的编辑距离来测定,利用索引树可以大大提高判定两个XML文档结构相似度的效率,XED距离测度可用于XML文档的结构搜索、XML文档聚类、XML文档结构抽取、XML文档的变换检测以及XML视图的增量计算和维护等。  相似文献   

3.
文档类型定义(DTD)是一类文档逻辑结构的共同特征的规范化描述,作为文档内容层次关系描述的结构是文档类型定义的一个具体体现,并被文档类型定义所制约。通过采用一种快速的定位方法来支持文档结构节点在文档类型定义中的定位,本文提出了一个基于文档类型定义约束的文档结构生成算法,该算法可为基于结构的文档处理提供高效的实时约束机制和更严格的验证机制。  相似文献   

4.
《程序员》2004,(10)
技术文档主题:对 UML 建模的几点体会作者:XiaoyshID:32231摘要:用例图和用例是两回事。用例图是描述用例和 actor 关系的图,用例之间的关系可通过不同的包组织来体现的,而用例间的使用、  相似文献   

5.
一个基于规则的图书逻辑结构提取算法   总被引:1,自引:0,他引:1  
在数字图书馆建设中,一个急需解决的问题是如何自动化地将海量的纸张图书数字化为电子文档。对于生成图书电子文档而言,除了文档内容信息以外,文档版面信息和文档逻辑信息同样重要。该文提出了一种基于规则的图书逻辑结构提取算法。从多页图书文档的模型描述出发,通过采用基于规则的推理方法,提取出图书中的逻辑元素并确定各元素间的层次关系和相互联系,从而得到了整本图书的逻辑结构。实验结果证明了算法的有效性。  相似文献   

6.
一种基于词共现的文档聚类算法   总被引:1,自引:0,他引:1       下载免费PDF全文
常鹏  冯楠  马辉 《计算机工程》2012,38(2):213-214
为解决文本主题表达存在的信息缺失问题,提出一种基于词共现的文档聚类算法。利用文档集上的频繁共现词建立文档主题向量表示模型,将其应用于层次聚类算法中,并通过聚类熵寻找最优的层次划分,从而准确反映文档之间的主题相关关系。实验结果表明,该算法所获得的结果优于其他基于短语的文档层次聚类算法。  相似文献   

7.
针对传统关系数据库与面向对象数据库之间信息交换所存在的不足,本文分析了XML文档和关系数据库模型/面向对象数据库模型对应关系,提出了基于XML文档中介的数据库间信息交互的算法。最后举例说明了如何利用XML文档来实现数据库的间的信息交互。  相似文献   

8.
多媒体信息系统首先需要对多媒体数据的内容给出尽量全面、详尽的表述,而目前存在的多媒体文档描述接口MPEG-7标准在信息描述能力上存在不足。针对这一问题,论文根据多媒体文档内容的抽象层次分类,提出了一个合理的层次化信息描述方法,并讨论了多媒体文档描述层次间的映射关系。  相似文献   

9.
一种篇章结构指导的中文Web文档自动摘要方法   总被引:29,自引:0,他引:29  
“摘要”、“关键词”是对文档内容提供简要概括的元数据,在Web信息检索中起着重要作用。针对Web信息检索的需求和Web文档的特点,采用拟人思维,提出了一种以篇章结构为指导的自动摘要方法。该方法对段落之间的内容语义关系进行分析,进而划分出文档的主题层次,得到文档的篇章结构;在篇章结构的指导下,使用统计方法和启发式规则来提取文档的关键词、关键句,生成文档的摘要。在实验评估中,该方法取得了令人满意的摘要质量和速度。  相似文献   

10.
在对已知案件和犯罪嫌疑人建模的基础上,结合社会网络方法对犯罪组织进行建模,并根据犯罪组织密度来判断该组织活动的频繁性,以及根据犯罪嫌疑人的危害程度、犯罪组织中心度等指标来建立犯罪组织层次树,推断犯罪组织的重要人员以及组织成员间的层次关系。实验结果显示,基于社会网络的犯罪组织层次树模型具有较好的实用性。  相似文献   

11.
提出一种面向制造业设计文档的模糊分类方法.利用领域本体的层次结构和概念间的语义关系,对设计文档进行结构划分与标注,通过特征词与概念之间的距离和位置重要性计算权重,提高了设计文档分类的准确性.  相似文献   

12.
抽取的目标是在多个文档中提取共有关键信息,其对简洁性的要求高于单文档摘要抽取。现有的多文档摘要抽取方法通常在句子级别进行建模,容易引入较多的冗余信息。为了解决上述问题,提出一种基于异构图分层学习的多文档摘要抽取框架,通过层次化构建单词层级图和子句层级图来有效建模语义关系和结构关系。针对单词层级图和子句层级图这2个异构图的学习问题,设计具有不同层次更新机制的两层学习层来降低学习多种结构关系的难度。在单词层级图学习层,提出交替更新机制更新不同的粒度节点,以单词节点为载体通过图注意网络进行语义信息传递;在子句层级图学习层,提出两阶段分步学习更新机制聚合多种结构关系,第一阶段聚合同构关系,第二阶段基于注意力聚合异构关系。实验结果表明,与抽取式基准模型相比,该框架在Multinews数据集上取得了显著的性能提升,ROUGE-1、ROUGE-2和ROUGE-L分别提高0.88、0.23和2.27,消融实验结果也验证了两层学习层及其层次更新机制的有效性。  相似文献   

13.
一种用于工作流的结构化数据模型及应用研究   总被引:1,自引:0,他引:1  
为了实现工作流中数据信息的层次化表达和管理,本文提出了一种结构化数据模型(SDM)。该模型通过文档信息表(DIF)将工作流的数据信息组织成串行、并行、条件和循环四种可递归定义的数据类型,给出了这些数据类型的数学定义,用树组织和描述文档信息表。本文还研究了通过SDM直接生成复合表单的方法。这种复合表单不仅包含了需要处理的属性数据,还包含了各属性之间的层次关系,使终端用户使用起来直观易懂。  相似文献   

14.
《电脑迷》2010,(4):11-12
文档管理混乱不只是陈小姐,也是大多数人容易犯的一个毛病。因为文档可以栖身在任何文件夹里面,如果之前没有合理的安排和组织,想在后期全部都通过改变物理位置来整理、集合,不太现实。  相似文献   

15.
文本挖掘是从非结构化的文本中发现潜在的概念以及概念间的相互关系。作为从浩瀚的Web信息资源中发现潜在的、有价值知识的有效技术,Web文本挖掘已倍受关注。文中提出了利用概念格来抽取隐含在文本中潜在的概念关系,将文本挖掘中文档与关键词之间的关系通过概念格结构呈现出来。  相似文献   

16.
一种自适应超媒体教学课件的组织方法   总被引:2,自引:0,他引:2  
讨论了一种教学超媒体课件的组织方法:围绕概念组织课件,概念由文档的集合解释。概念之间的链表示语义间的相互联系,文档和链的信息存储在数据库里,每个文档有相应的难度级别。系统根据学对每个概念掌握的情况信息,引导学生到合适的文档处学习。  相似文献   

17.
针对VSM不能揭示隐藏在不同特征词后面的相同概念语义、反映文档中的潜在语义关系、在相似度计算中精度较低的问题,提出一种基于领域本体的文档向量空间模型DOBVSM(domain ontology-based vector spacemodel)。该模型把领域本体中的概念扩展为文档特征词,并通过概念间的语义关系对特征词权重进行调整,最终建立包含语义关系的文档DOBVSM。通过实验分析表明:DOBVSM计算的文档相似度值更加发散,与专家评价值最为接近,能够较好地反映文档之间的相似情况。  相似文献   

18.
文档图像理解中最重要的部分是逻辑结构的提取。目前的研究主要集中在页面的布局分析上,少数对文档逻辑结构的研究只是针对单页文档或页面关系简单的多页文档。建筑标书的特殊性在于其层次式的逻辑组成结构没有明确的索引信息标识。本文提出了一种利用页面间引用关系获取文档逻辑结构的方法。该方法采用修正的树形结构表示文档的逻辑结构,逻辑树的创建过程就是逻辑结构的获取过程,而且有利于更高层的语义处理及还原输出。该方法已在标书自动处理系统中实现,保证了该系统的灵活和高效。  相似文献   

19.
一种新的XML文档编码机制   总被引:7,自引:1,他引:7  
XML查询中正则路径表达式的实现,需要快速判断元素间父子关系或祖先一后代关系。目前,基于树遍历的XML文档编码是一种主流的方法,但父子关系的判断需要在编码之外附加辅助的措施,部分实现不支持文档更新,提出一种新的编码方法,能够在常数复杂度的时间内实现两个元素间父子关系、祖先一后代关系的判断,计算祖先一后代结点间的辈数差异,并支持文档更新功能。  相似文献   

20.
层次关系是中文文本概念间存在的最为重要的关系之一,对层次关系的正确判定是进行领域本体自动构建、文本数据挖掘等信息处理的基础研究内容。先将概念间可能存在的候选层次关系罗列出来,构建词性序列语义余弦相似度和关系词语余弦相似度混合的核函数分类器,将概念间层次关系的挖掘问题转化为分类问题;再通过对文本数据进行模板标注来训练分类器;最后输入预处理后的中文文本,使用核函数分类器对候选层次关系进行判定。以空军武器装备领域的中文文本为测试数据,通过实验表明,该方法简单可靠,具有较好的正确率和召回率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号