首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 156 毫秒
1.
标注《文心雕龙》的篇章结构,据此研究其连接词的显隐、语义及用法。研究发现: (1)隐式关系(78.1%)多于显式关系(21.9%),17类关系仅有四类(因果、转折、假设、目的)显多隐少; (2)各类关系的同义连接词种数与使用有差异,其中种数最多17(顺承),最少则无(总分、背景); (3)连接词(56种)单义为多(44),多义为少(12),义项最多为5,分布有差异。最后,个案分析同义连接词与多义连接词的用法,并与同时期著作连接词的使用进行了对比。  相似文献   

2.
篇章关系分为显式和隐式两种。显式关系的显著特征是篇章的基本单元之间存在显式连接词。针对汉语显式篇章关系,构建了包括汉语连接词识别和篇章关系分类的显式篇章关系分析平台。该文选取汉语宾州树库(Chinese Penn Treebank, CTB)中的500篇文本进行了汉语显式篇章关系标注;结合连接词的中心词,采用最大熵分类器构建了汉语连接词识别模块,其性能F1值达到了66.79%;基于连接词及其词性等上下文特征,构建了篇章关系分类器,其在最顶层4大类语义关系上的分类性能的F1值为91.92%。  相似文献   

3.
由于缺乏显式连接词,隐式篇章关系识别是一个具有挑战性的任务.文中提出了一种结合主动学习和多任务学习来间接扩充隐式篇章关系训练数据的隐式篇章关系识别方法,旨在在增强训练数据的同时尽量少地引入伪隐式篇章关系数据中的噪声.首先,基于BERT模型通过主动学习方法的分类不确定性来选择部分显式篇章关系样本;然后,移除显式篇章关系数据中的显式连接词作为伪隐式篇章关系数据;最后,采用多任务学习方法使伪隐式篇章关系数据有助于隐式篇章关系识别.在中文篇章树库(CDTB)上进行的实验的结果显示,相比基准模型,所提方法在宏平均F1、微平均F1值上均得到了提高.  相似文献   

4.
基于Penn Discourse TreeBank(简称PDTB)语料中的隐式篇章关系类型,提出一种无指导的识别方法。主要依据显式与隐式平行论元对之间的映射关系实现显式到隐式关系的推理,即利用显式论元对的篇章关系,推理与之平行的隐式论元对的篇章关系。推理过程主要包括:基于大规模语料库以及基于搜索引擎的平行语料挖掘,平行语料中显式连接词映射到篇章关系过程的消歧。与传统基于监督学习的分类方法相比,基于统计的无指导方法在隐式篇章关系推理的性能上获得显著提升,识别精确率提高了近15.6%。此外,在分析比较各研究方法的同时,指出目前隐式篇章关系推理研究所面临的主要困难与挑战。  相似文献   

5.
法律文本中有一种表条件“的”字结构,该文对其英译进行语法标注与统计分析。考察《民法通则》的汉英平行文本,确定“的”字结构的英语对应单位。统计“的”字结构的英语对应单位,发现: 1.状语远多于定语(85.40%>14.60%);2.限定式远多于非限定式(87.59%>12.41%),限定式中一般现在时占绝对多数(99.17%),非限定式以介词短语为多(64.71%);3.状语引导词以if 为多(86.32%),定语引导词以who为多(60.00%)。研究认为,法律文本中此类“的”字结构是句而非短语,而其中的“的”是表条件的篇章连接词。  相似文献   

6.
由于缺少连接词信息,隐式篇章关系识别模型需要基于两个论元(子句或者句子)的语义来推导它们之间的篇章关系,但目前性能还比较低.对于语料标注人员而言,隐式篇章关系的标注是很困难的,他们通常先插入一个合适的连接词用于辅助隐式篇章关系的标注.基于上述情况,文中提出了一种基于知识蒸馏的隐式篇章关系识别方法,其目的是利用语料标注时插入的连接词信息来提高识别的性能.具体地,先构建一个连接词增强的模型用于融合连接词信息,然后基于知识蒸馏的方式把连接词增强模型学到的知识迁移到隐式篇章关系识别模型中.实验结果表明,在常用的PDTB数据集上,所提方法取得了比同类基准方法更好的识别性能.  相似文献   

7.
该文提出一种基于信息检索的无指导方法,用于推理隐式篇章片段之间的语义连接关系,如因果关系、转折关系等。该文基于Google搜索引擎,抽取在句子结构以及语义层面上均与原隐式片段相似的显式片段,通过分析和识别相关显式关系来间接推理隐式关系。主要包括以下三个模块 构建高质量查询关键词并抽取候选显式关系;结合三种隐式关系推理模型(相似度、置信度、关联度),综合考察查询关键词以及候选关系的质量;基于排序学习的方法,统计高质量候选关系中的类别分布以实现最终隐式关系的推理。该文采用Penn Discourse TreeBank 2.0篇章语料库,最终方法精确率达到54.3%,与有指导的方法相比,提高了约14.3%。  相似文献   

8.
李邵莹  孟丹  孔超  张丽平  徐辰 《软件学报》2023,34(10):4851-4869
近年来,社交推荐的研究主要聚焦于社交网络中显式、隐式关系的联合建模,却忽视了高阶隐式关系并非对每个用户都同等重要这一特殊现象.高阶隐式关系对一个有着足够多邻居的用户与一个仅有少量邻居的用户重要性存在明显差异.此外,由于社交关系建立的随机性,显式关系并不总是可用的.提出了一种新的自适应高阶隐式关系建模方法 (adaptive high-order implicit relations modeling, AHIRM),该模型由3个部分组成:首先,过滤不可靠关系且识别出潜在可靠关系.旨在避免不可靠关系带来的负面影响,并部分缓解数据稀疏的问题;其次,设计自适应随机游走算法,结合规范化后的节点中心度为用户捕获不同阶数的邻居,构建用户间的高阶隐式关系,进而重构社交网络;最后,运用图卷积网络(graph convolutional network, GCN)聚合邻居节点信息,更新用户嵌入,实现高阶隐式关系建模,从而进一步缓解数据稀疏问题.在建模过程中,同时考虑到社交结构和个人偏好的影响,模拟并保留了社交影响传播的过程.在LastFM、Douban和Gowalla这3个数据集上与相关算法做了对比验证...  相似文献   

9.
隐式篇章关系识别是自然语言处理中一项富有挑战性的任务,旨在判断缺少连接词的两个论元(子句或者句子)之间的语义关系(例如转折)。近年来,随着深度学习在自然语言处理领域的广泛应用,各种基于深度学习的隐式篇章关系识别方法取得了不错的效果,其性能全面超越了早期基于人工特征的方法。文中分三大类对最近的隐式篇章关系识别方法进行讨论:基于论元编码的方法、基于论元交互的方法和引入显式篇章数据的半监督方法。在PDTB数据集上的实验结果显示:1)通过显式地建模论元中词或文本片段之间的语义关系,基于论元交互的方法的性能明显好于基于论元编码的方法;2)引入显式篇章数据的半监督方法能有效地缓解数据稀疏问题,从而进一步提升识别的性能。最后,分析了当前面临的主要问题,并指出了未来可能的研究方向。  相似文献   

10.
篇章是论元经过语义关联和结构化组织形成的自然语言文体.篇章分析研究的核心任务之一是解释论元的语义关系,其中,显式关系因具有直观线索而易于检测,目前检测精度高达90%;相对而言,隐式关系因缺乏直观线索而难于检测,目前精度仅约40%.针对这一问题,基于一种"论元平行则关系平行"的假设,并利用显式篇章关系易于检测的特点,通过平行论元的识别与平行关系的消歧,实现了一种显式关系平行推理隐式关系的隐式篇章关系检测方法.利用标准宾州篇章关系树库(Penn discourse Tree Bank,简称PDTB)对这一检测方法进行评测,结果显示,精确率提升达17.26%.  相似文献   

11.
In this paper, the use of implicit multigrid smoothers for challenging aerodynamic simulations is explored. The block lower–upper symmetric Gauss–Seidel (LU-SGS) and hybrid Runge–Kutta/LU-SGS schemes are implemented in Bombardier’s multiblock Navier–Stokes solver, FANSC. The schemes are compared to the existing Runge–Kutta and point-Jacobi preconditioned explicit multistage smoothers. Through tests ranging from 2D airfoils to 3D wing-body-engine cases, the computational speed-up and robustness of the implicit schemes are evaluated. It is shown that the implicit smoothers present a computational speed-up of at least two, and are significantly more robust, especially for flow problems involving the “power-on” engine boundary condition.  相似文献   

12.
Implicit discourse relation recognition aims to discover the semantic relation between two sentences where the discourse connective is absent. Due to the lack of labeled data, previous work tries to generate additional training data automatically by removing discourse connectives from explicit discourse relation instances. However, using these artificial data indiscriminately has been proven to degrade the performance of implicit discourse relation recognition. To address this problem, we propose a co-training approach based on manual features and distributed features, which identifies useful instances from these artificial data to enlarge the labeled data. In addition, the distributed features are learned via recursive autoencoder based approaches, capable of capturing to some extent the semantics of sentences which is valuable for implicit discourse relation recognition. Experiment results on both the PDTB and CDTB data sets indicate that: (1) The learned distributed features are complementary to the manual features, and thus suitable for co-training. (2) Our proposed co-training approach can use these artificial data effectively, and significantly outperforms the baselines.  相似文献   

13.
There are numerous applications where we have to deal with temporal uncertainty associated with objects. The ability to automatically store and manipulate time, probabilities, and objects is important. We propose a data model and algebra for temporal probabilistic object bases (TPOBs), which allows us to specify the probability with which an event occurs at a given time point. In explicit TPOB-instances, the sets of time points along with their probability intervals are explicitly enumerated. In implicit TPOB-instances, sets of time points are expressed by constraints and their probability intervals by probability distribution functions. Thus, implicit object base instances are succinct representations of explicit ones; they allow for an efficient implementation of algebraic operations, while their explicit counterparts make defining algebraic operations easy. We extend the relational algebra to both explicit and implicit instances and prove that the operations on implicit instances correctly implement their counterpart on explicit instances.  相似文献   

14.
篇章句间关系识别(Discourse Relation Recognition)是篇章分析的重要内容,该文对中文篇章句间关系识别任务进行初步探索,包括显式篇章句间关系识别与隐式篇章句间关系识别两类任务。针对显式篇章句间关系,我们提出基于关联词规则的方法进行识别,取得了很好的效果;针对隐式篇章句间关系,我们抽取词汇、句法、语义等特征,采用有指导模型进行识别。该文的分析和实验结果为后续研究提供了参考和基本对照系统。  相似文献   

15.
否定义是深层语义表示中的一个重要组成部分。该文基于语料库的方法对现代汉语中的否定表达形式及其使用规律进行深入分析。首先,系统地收集否定表达形式,将之分为显性否定词、隐性否定词、否定结构三类,并讨论否定表达形式的非否定用法。其次,对否定表达形式的使用规律进行归纳与总结,涉及单动核结构、情态成分、述补结构、动词性并列结构、连谓结构、兼语结构等,重点分析多动核结构中否定对命题义的影响,并总结在深层语义标注框架下否定义的标注规则。最后,基于多领域句法树库考察否定表达形式的领域分布差异。  相似文献   

16.
篇章关系识别是篇章分析的核心组成部分。汉语中,缺少显式连接词的隐式篇章关系占比很高,篇章关系识别更具挑战性。该文给出了一个基于多层局部推理的汉语篇章关系及主次联合识别方法。该方法借助双向LSTM和多头自注意力机制进行篇章关系对应论元的表征;进一步借助软对齐方式获取论元间局部语义的推理权重,形成论元间交互语义信息的表征;再将两类信息结合进行篇章关系的局部推理,并通过堆叠多层局部推理部件构建了汉语篇章关系及主次联合识别框架,在CDTB语料库上的关系识别F1值达到了67.0%。该文进一步将该联合识别模块嵌入一个基于转移的篇章解析器,在自动生成的篇章结构下进行篇章关系及主次的联合分析,形成了完整的汉语篇章解析器。  相似文献   

17.
缪峰  王萍  李太勇 《计算机科学》2022,49(3):276-280
抽取事件之间的因果关系能够应用于自动问答、知识提取、常识推理等方面。隐式因果关系由于缺乏明显的词汇特征和中文复杂的句法结构,使得其抽取极为困难,已成为当前研究的难点。相比而言,显示因果关系的抽取比较容易、准确率高,且因果关系事件之间的逻辑关系稳定。为此,文中提出了一种原创的方法,首先通过对抽取的显示因果事件对进行事件动作的归一化处理后形成事件方向,然后对事件主体进行泛化处理,最终形成标准的匹配因果事件对集合。利用此集合根据事件相似度从语句中抽取隐式因果事件对。为了识别更多的隐式因果关系,文中同时提出了一种因果连接词发现算法。在网易财经、腾讯财经和新浪财经上爬取的实验数据验证,对事件动作进行归一化处理后形成事件方向相比传统方法抽取准确率提高了1.02%。  相似文献   

18.
汉语简洁灵活的意合型篇章组合结构,对传统的基于关联词的篇章连贯性描述体系提出了新的挑战。该文引入话题链描述形式,设计不同类型的话题评述关系集,构建了以话题链为主,融合关联词语和其他连贯形式描述机制,覆盖话题评述、并列、因果、转折四大类关系的汉语语篇连贯性描述体系。在清华句法树库TCT上进行的验证实验,发现话题链和关联词语分别覆盖了约76%和50%的汉语复句,并且两者经常同时使用,初步证明了这个体系在句子连贯性描述方面的可行性和有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号