期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

王宏显周强邬晓钧《中文信息学报》2008,22(5):90-96

在真实语言环境中,词语间的联系普遍存在、错综复杂。为了更好融合和使用各种语义资源库中的语义关系,构建可计算的汉语词汇语义资源,该文提出了通过构建语义关系图整合各种语义资源的方法,并在《知网》上实现。《知网》作为一个知识库系统,对各个词语义项是以分条记录的形式存储的,各种词汇语义关系隐含在词典文件和义原描述文件中。为提取《知网》中语义间的关系,本文首先将《知网》中的概念以概念树的形式重新表示,并从概念树中提取适当的语义关系,构建语义关系图。经过处理,得到88种589 984条语义关系,图上各种节点具有广泛的联系,为基于语义关系图的进一步分析和计算打下了基础。相似文献

2.

基于多重注意力机制的中文医疗实体识别

陈明刘蓉张晔《计算机工程》2023,(6):314-320

医疗实体识别是从医疗文本中识别疾病、症状、药物等多种类型的医疗实体，能够为知识图谱、智慧医疗等下游任务的发展提供支持。针对现有命名实体识别模型提取语义特征较单一、对医疗文本语义理解能力不足的问题，提出一种基于多重注意力机制的神经网络模型MANM。为捕获文本中更丰富的语义特征，在模型输入中引入医疗词汇先验知识，通过自注意力机制获取医疗文本的全局语义特征，并利用双线性注意力机制获取词汇和字符层面的潜在语义特征，得到包含字词间依赖关系的特征向量。为提高模型的上下文信息捕捉能力，采用改进的长短时记忆网络提取文本时序特征，同时设计多头自注意力机制获取词语间隐含的关联语义特征。最后融合上述多层次语义特征，利用条件随机场进行实体识别。在公开数据集CMeEE、CCKS2019、CCKS2020上进行对比实验，实验结果表明，MANM模型在3个数据集上的F1值分别达到64.29%、86.12%、90.32%，验证了所提方法在医疗实体识别中的有效性。相似文献

3.

一种多策略通用模式匹配方法 总被引：2，自引：0，他引：2

程伟周龙骧林河水孙玉芳《计算机科学》2004,31(11):121-123

模式匹配问题即寻找不同模式元素之间的语义对应关系，在数据仓库、异构数据源集成及语义Web等领域都是非常重要的研究基础。目前模式匹配仍大多主要由人工来完成，因此有很大局限性。提出了一种多策略通用模式匹配架构，可以方便地兼容其他匹配策略。采用了一种基于词语间语义距离的方法来计算其语义相似度；提出了一种基于相似度传播的结构匹配算法，有效地考虑了相邻相似节点间的相互影响。实验结果表明这种匹配方法在处理模式匹配任务时能达到较高的精度。相似文献

4.

基于多策略的单文档问答式信息检索技术

杜永萍何明《计算机科学》2009,36(7):193-196

单文档问答式信息检索,即是阅读理解(Reading Comprehension,简称RC).该任务的目的在于理解一篇文档并对提出的问题返回答案句.提出了充分利用外部资源采用多策略技术来提高RC系统性能的方法,包括基于Web的答案模式匹配应用、词汇语义关联推理以及上下文辅助等策略.本方法使得RC系统性能在Remedia标准测试集上的性能得到提高.描述了不同策略对提高系统性能的有效性,t-test结果表明,运用答案模式匹配和词汇语义关联推理策略所得到的性能显著提高;同时分析了指代消解策略在系统中的关键作用;最后比较了RC任务和多文档问答式信息检索(Question Answering,简称QA)任务的差异性. 相似文献

5.

融合语义和句法图神经网络的实体关系联合抽取

衡红军苗菁《计算机科学》2023,(9):295-302

实体关系抽取任务是信息抽取的核心任务，它对于有效地从爆炸性增长的数据中提取出关键性的信息有着不可替代的作用，也是构建大规模知识图谱的基础任务，因此研究实体关系抽取对各种自然语言处理任务具有重要意义。尽管现有的基于深度学习方法的实体关系抽取已经有了很成熟的理论和较好的性能，但依然还存在着误差累积、实体冗余、交互缺失、三元组重叠等问题。语义信息和句法信息对自然语言处理任务都具有重要作用，为了充分利用这些信息以解决上述提到的问题，提出了一种融合语义和句法图神经网络的二元标记实体关系联合抽取模型FSSRel(Fusion of Semantic and Syntactic Graph Convolutional Networks Binary Tagging Framework for Relation triple extraction)。该模型分为三个阶段进行：第一阶段，对三元组主体的开始结束位置进行预测标记；第二阶段，分别通过语义图神经网络和句法图神经网络提取语义特征和句法特征，并将其融合进编码向量；第三阶段，对语句的每种关系的客体位置进行预测标记，完成最终三元组的提取。实验结果表明，在... 相似文献

6.

融合细粒度实体类型的多特征关系分类算法

下载免费PDF全文

左亚尧易彪黎文杰《计算机工程与应用》2022,58(22):65-71

近年来,基于深度学习的关系分类多集中于注意力机制的改进或语义信息的优化两方面,但此类方法提取的特征往往较为单一,忽略了实体类型对关系分类的影响,且存在语义信息学习不完整等问题。提出一种新的关系分类方法Type-SBNE,针对实体类型学习任务,引入细粒度的实体类型信息,并通过对每个实体类型中的所有实体向量取平均生成实体类向量,再分别通过实体与句意信息学习获得其对应的特征向量,通过拼接融合得到复合语义特征,最后采用全连接层和Softmax函数来预测实体对之间的关系。Type-SBN基于细粒度的实体类型信息,丰富了实体的特征,有效加强了每个实体在上下文中的表达。实验表明,Type-SBNE模型可更好地完成关系分类任务,效果优于对比方法。相似文献

7.

语义与句法信息加强的二元标记实体关系联合抽取

衡红军苗菁《计算机工程》2023,(4):77-84

随着互联网技术不断地发展，数据信息呈爆炸性增长,迫切需要从海量数据中高效地提取关键信息，而实体关系抽取作为信息抽取的核心任务，发挥着不可替代的重要作用。现有基于深度学习的实体关系抽取方法存在误差累积、实体冗余、交互缺失、实体关系重叠等问题。为充分利用语句的语义信息和句法信息，提出一种加强语义信息与句法信息的二元标记实体关系联合抽取模型SSERel。通过对输入文本进行BERT编码，并对三元组主体的开始位置和结束位置进行预测标记，提取文本的全局语义特征、主体与每个词语的局部语义特征以及句法特征，并将其融合进编码向量。对语句每种关系的客体位置进行预测标记，最终完成三元组的提取。在NYT和WebNLG数据集上的实验结果表明，相比CasRel模型，该模型的F1值分别提升2.7和1.4个百分点，能够有效解决复杂数据中存在的重叠三元组和多三元组等问题。相似文献

8.

《同义词词林》在中文实体关系抽取中的作用

刘丹丹彭成钱龙华周国栋《中文信息学报》2014,28(2):91-99

语义信息在命名实体间语义关系抽取中具有重要的作用。该文以《同义词词林》为例,系统全面地研究了词汇语义信息对基于树核函数的中文语义关系抽取的有效性,深入探讨了不同级别的语义信息和一词多义等现象对关系抽取的影响,详细分析了词汇语义信息和实体类型信息之间的冗余性。在ACE2005中文语料库上的关系抽取实验表明,在未知实体类型的前提下,语义信息能显著提高抽取性能;而在已知实体类型的情况下,语义信息也能明显提高某些关系类型的抽取性能,这说明《词林》语义信息和实体类型信息在中文语义关系抽取中具有一定的互补性。相似文献

9.

语义关系抽取发展现状及抽取方法的研究

黄晨《福建电脑》2009,25(6):45-46

命名实体语义关系抽取是信息抽取中的主要任务之一,本文对现有的语义关系抽取系统构建方法进行了分类和介绍,并对这些方法进行了讨论和比较,回顾语义关系抽取研究的历史,总结语义关系抽取技术的现状,将有助语义关系抽取技术研究工作的向前发展。相似文献

10.

汉语基本块描述体系 总被引：2，自引：1，他引：2

周强《中文信息学报》2007,21(3):21-27

块分析是自然语言处理研究中的重要技术,其处理基础是设计一套合理有效的块描述体系。本文在吸收和总结前人研究成果和经验的基础上,提出了一套基于拓扑结构的汉语基本块描述体系。它通过引入词汇关联信息确定基本拓扑结构,形成了很好的基本块内聚性判定准则,建立了句法形式与语义内容的有机联系桥梁。这套描述体系大大简化了从现有的句法树库TCT中自动提取基本块标注语料库和相关词汇关联知识库的处理过程,为进一步进行汉语基本块自动分析和词汇关联知识获取互动进化研究打下了很好的基础。相似文献

11.

中文实体关系抽取研究综述

武文雅陈钰枫徐金安张玉洁《计算机与现代化》2018,(8):21

作为信息抽取任务中极为关键的一项子任务,实体关系抽取对于语义知识库的构建和知识图谱的发展都有着重要的意义。对于中文而言,语义关系更加复杂,实体关系抽取的作用也就愈加显著,因此,对中文实体关系抽取的研究方法进行详细考察极为必要。本文从实体关系抽取的产生和发展开始,对目前基于中文的实体关系抽取技术现状作了阐述;按照关系抽取方法对语料的依赖程度分为4类：有监督的实体关系抽取、无监督的实体关系抽取、半监督的实体关系抽取和开放域的实体关系抽取,并对这4类抽取方法进行具体的分析和比较;最后介绍深度学习在中文实体关系抽取上的应用成果和发展前景。相似文献

12.

基于合一句法和实体语义树的中文语义关系抽取 总被引：1，自引：0，他引：1

虞欢欢钱龙华周国栋朱巧明《中文信息学报》2010,24(5):17-24

该文提出了一种基于卷积树核函数的中文实体语义关系抽取方法,该方法通过在关系实例的结构化信息中加入实体语义信息,如实体类型、引用类型和GPE角色等,从而构造能有效捕获结构化信息和实体语义信息的合一句法和实体语义关系树,以提高中文语义关系抽取的性能。在ACE RDC 2005中文基准语料上进行的关系探测和关系抽取的实验表明,该方法能显著提高中文语义关系抽取性能,大类抽取的最佳F值达到67.0,这说明结构化句法信息和实体语义信息在中文语义关系抽取中具有互补性。相似文献

13.

复杂中文文本的实体关系抽取研究

王苑徐德智陈建二《计算机科学》2009,36(8):208-211

实体关系抽取是信息抽取研究领域中的重要研究课题之一.针对已有方法在处理复杂文本上的不足,提出了复杂中文文本的实体关系抽取方法.结合中文文本的语法特征,提出了7条抽取关系特征序列的启发式规则,并采用语义序列核和KNN机器学习算法结合的方法来分类和标注关系的类型.通过对ACE评测定义下的两个子类的实体关系抽取,关系抽取的平均F值迭到了76%,明显高于传统的基于特征向量和最短依存路径核的方法. 相似文献

14.

深度学习实体关系抽取研究综述 总被引：3，自引：0，他引：3

鄂海红张文静肖思琪程瑞胡莺夕周筱松牛佩晴《软件学报》2019,30(6):1793-1818

实体关系抽取作为信息抽取、自然语言理解、信息检索等领域的核心任务和重要环节,能够从文本中抽取实体对间的语义关系.近年来,深度学习在联合学习、远程监督等方面上的应用,使关系抽取任务取得了较为丰富的研究成果.目前,基于深度学习的实体关系抽取技术,在特征提取的深度和模型的精确度上已经逐渐超过了传统基于特征和核函数的方法.围绕有监督和远程监督两个领域,系统总结了近几年来中外学者基于深度学习的实体关系抽取研究进展,并对未来可能的研究方向进行了探讨和展望. 相似文献

15.

面向司法案件的案情知识图谱自动构建

洪文兴胡志强翁洋张恒王竹郭志新《中文信息学报》2020,34(1):34-44

以法学知识为中心的认知智能是当前司法人工智能发展的重要方向。该文提出了以自然语言处理(NLP)为核心技术的司法案件案情知识图谱自动构建技术。以预训练模型为基础,对涉及的实体识别和关系抽取这两个NLP基本任务进行了模型研究与设计。针对实体识别任务,对比研究了两种基于预训练的实体识别模型;针对关系抽取任务,该文提出融合平移嵌入的多任务联合的语义关系抽取模型,同时获得了结合上下文的案情知识表示学习。在“机动车交通事故责任纠纷”案由下,和基准模型相比,实体识别的F₁值可提升0.36,关系抽取的F₁值提升高达2.37。以此为基础,该文设计了司法案件的案情知识图谱自动构建流程,实现了对数十万份判决书案情知识图谱的自动构建,为类案精准推送等司法人工智能应用提供语义支撑。相似文献

16.

基于本体关系匹配的信息抽取 总被引：3，自引：0，他引：3

下载免费PDF全文

何召卫陈俊亮《计算机工程》2007,33(21):207-209

目前，稳定可靠的信息抽取是一个有待解决的问题，该文提出了基于本体关系匹配信息抽取算法，应用语义Web把信息抽取目标文档描述为特殊的本体格式，采用机器学习理论对本体进行分析和处理。测试数据集的实验结果显示，本体关系集匹配算法优于其他4种信息抽取算法。相似文献

17.

词汇语义信息对中文实体关系抽取影响的比较 总被引：1，自引：0，他引：1

刘丹丹彭成钱龙华周国栋《计算机应用》2012,32(8):2238-2244

提出一种将《同义词词林》和《知网》的语义信息融合到基于树核函数的中文关系抽取方法,并比较和分析了两种语义信息对中文实体关系抽取的影响,同时探讨了这两种语义信息与实体类型信息之间的相互关系。实验结果表明,该方法能在一定程度上提高中文关系抽取的性能;同时,《同义词词林》能补充实体类型信息的不足,因而无论是否加入实体类型信息,其语义信息都能大幅度地提高大部分关系类型的抽取性能;而《知网》则和实体类型信息存在冲突,因此在已知实体类型信息的前提下,仅能提高个别关系类型的抽取性能。相似文献

18.

基于语义角色的实体关系抽取

下载免费PDF全文

毛小丽何中市邢欣来刘莉《计算机工程》2011,37(17):143-145

提出一种实体关系抽取方案,该方案根据实体关系抽取的特点,在常用特征基础上新增语义角色特征用于构建特征向量,并利用支持向量机构造分类器。在SemEval-2010评测任务8提供的数据上进行实验,在判断候选实体对的关系类型上F1值达到81.6%,与未加入语义角色特征相比提高4%,结果表明该方案语义角色特征有利于实体语义关系抽取。相似文献

19.

融合多特征BERT模型的中文实体关系抽取

谢腾杨俊安刘辉《计算机系统应用》2021,30(5):253-261

关系抽取是构建知识图谱的一项核心技术.由于中文具有复杂的语法和句式,同时现有的神经网络模型提取特征有限以及语义表征能力较差,从而影响中文实体关系抽取的性能.文章提出了一种融合多特征的BERT预训练模型的实体关系抽取算法.首先对语料进行预处理,提取关键词、实体对信息和实体类型特征并进行融合,以此来强化BERT模型的语义学习能力,极大限度地减少了语义信息特征的丢失,最后通过Softmax分类器进行关系分类.实验结果表明,文章模型优于现有的神经网络模型.在人工标注的中文数据集上本文模型取得了97.50％的F1值. 相似文献