期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

结合Hybrid Attention机制和BiLSTM-CRF的汉语否定语义表示及标注

李晋荣吕国英李茹柴清华王超《计算机工程与应用》2023,(9):167-175

阅读理解中否定是一种复杂的语言现象，其往往会反转情感或态度的极性。因此，正确分析否定语义对语篇理解具有重要意义。现有否定语义分析方法存在两个问题：第一，研究的否定词较少达不到应用目的；第二，目前汉语否定语义标注只是标注整个句子，这无法明确否定语义。针对该问题提出基于汉语框架语义知识库（Chinese FrameNet）进行否定语义角色标注方法。在框架语义学理论指导下结合汉语否定语义特征对已由FrameNet继承的否定框架重新构建；为了解决捕捉长距离信息以及句法特征问题，提出一种基于Hybrid Attention机制的BiLSTMCRF语义角色标注模型，其中，Hybrid Attention机制层将局部注意与全局注意结合准确表示句子中的否定语义，BiLSTM网络层自动学习并提取语句上下文信息，CRF层预测最优否定语义角色标签。经过比对验证，该模型能够有效提取出含有否定语义信息，在否定语义框架数据集上F1值达到89.82%。相似文献

2.

具有两种否定的描述逻辑系统MALC 总被引：1，自引：0，他引：1

下载免费PDF全文

程天笑潘正华《计算机工程与科学》2008,30(11):65-67

否定信息在知识表示和推理中具有非常重要的作用。随着信息科学的发展,大量的事实表明：信息科学的许多领域需要区分概念的矛盾否定和对立否定。描述逻辑作为一阶谓词逻辑的可判定子集,并没有区分概念的矛盾否定与对立否定。本文将模糊否定词～和对立否定词引入描述逻辑ALC,建立了一个扩展的描述逻辑系统MALC,使其具有处理模模糊知识的能力。同时,文章给出了基于中介无穷值语义模型的语义解释;在推理机制上,给出了可满足性的定义和可满足性的Tableau算法。相似文献

3.

汉语逻辑补足义标注框架研究

张坤丽韩英杰贾玉祥穆玲玲穗志方昝红英《中文信息学报》2019,33(2):8-16

逻辑补足义是指附加在以谓词为中心的基本命题成分之上的否定、程度、时体、模态和语气等, 具体表现为逻辑语义算子对谓词的语义约束关系,是基本命题成分所表达语义关系的有效补充。在句子中,逻辑补足义所表达的语义是句子深度语义理解的重要层面。该文以深层语义理解为目标,在逻辑补足义已有的研究基础上,建立了否定、程度、时体和语气分类体系,构建了相应的算子词典;制定标注规范,对已经标注了基本命题义语义角色的句子进行各类逻辑补足义的标注;最后,对标注的结果进行统计并对标注过程中出现的问题进行了分析。相似文献

4.

一种改进的汉语语义角色分类体系与标注实践

宋衡曹存根王亚王石《中文信息学报》2023,(1):16-32

语义角色标注是自然语言处理中的一项重要任务,涉及文本挖掘、神经网络学习、统计语言学等多个研究领域。在对一个汉语语料库进行语义角色分析时,发现现有的汉语语义角色体系存在一定的局限性。通过引入新的语义角色、吸收和重新定义现有语义角色体系中的语义角色,该文提出了一种改进的汉语语义角色分类体系。该语义角色分类体系将事件中的语义角色分为两大类,即中枢语义角色和周边语义角色,其中,周边语义角色可进一步被细分为主要周边语义角色和辅助周边语义角色。为了减少语义理解的主观性从而客观地判断语义角色类型,该文基于语义和句式以“判断标准-相应例句”的形式详细解释了语义角色分类体系中的主要周边语义角色,并从中枢语义角色半自动化判断、复合动词作中枢语义角色处理、易混淆语义角色难点分析和辅助周边语义角色标注规定等多个方面给出了提高语义角色标注一致性的说明。最后,根据提出的语义角色分类体系对实验语料库进行了语义角色的标注实践,分析了标注一致性,统计了新提出和重定义的主要周边语义角色在语料库中的分布情况,并与基于鲁川语义角色分类体系得到的标注结果进行了对比。相似文献

5.

基于规则的“把”字句语义角色标注

何保荣邱立坤徐德宽《中文信息学报》2017,31(1):84-93

“把”字句是现代汉语中一种重要的特殊句式,该文尝试用基于知识库的规则方法对把字句进行语义角色自动标注。首先,我们从《人民日报》语义角色标注语料库中收集把字句例句,形成一个覆盖范围较广的把字句例句库;之后,对例句库中把字句的句法和语义构成规律进行手工标注,标注内容包括谓语动词的配价类型、把字句谓语结构类型、把字句句模类型等。在上述标注的基础上,对把字句的句模构成规律进行分析,总结出若干条语义角色标注规则;最后,在测试数据上对前述规则进行验证,语义角色标注的最终正确率为98.61%,这一结果说明该文所提出的规则在把字句语义角色标注上是有效的。相似文献

6.

基于领域本体的语义标注方法研究 总被引：3，自引：0，他引：3

时念云杨晨《计算机工程与设计》2007,28(24):5985-5987

介绍了语义Web.本体以及语义标注的基本概念,对语义标注方法以及现有技术工具进行了简单地说明和分析,提出了一种基于领域本体的语义标注方法,并结合石油产品领域的本体对该方法进行了实例说明.该方法通过分析文档的特征词汇,使用基于领域本体的空间向量模型方法建立词汇与本体概念之间的映射.采用这种方法对文档进行语义标注后,可以把文档隐含的语义信息显式的表现出来,这样数据库内部文档之间就具有了语义关联关系,为检索的智能推理提供基础. 相似文献

7.

“X什么”类否定义构式探析

夏雪詹卫东《中文信息学报》2015,29(5):1-9

该文区分了“言语行为否定”和“命题真值否定”两类否定义: 前者表达对某种行为状态的否定态度(谴责、拒绝、禁止等);后者否定某个命题: 或者否定命题的“真值条件”、或者否定命题的“适宜条件”、或者否定命题主目的“典型条件”,表达“X未达某标准”。此外,进一步对两类否定义的基本要素及要素间的关系进行分析,讨论了表达每一类语义的“X什么”类构式的变项选择限制与实际使用情况,并总结了“X什么”类构式间的异同。相似文献

8.

基于本体知识库的自动语义标注*

戚欣肖敏孙建鹏《计算机应用研究》2011,28(5):1742-1744

为了产生语义Web中的元数据,需要提取Web文档中的语义信息。面对海量的Web文档,自动语义标注相对人工和半自动的语义标注是可行的方法。提出的基于本体知识库的自动语义标注方法,旨在提高标注的质量。为识别出文档中的候选命名实体,设计了语义词典的逻辑结构,论述了以实体之间语义关联路径计算语义距离的方法。语义标注中的复杂问题是语义消歧,提出了基于最短路径的语义消歧方法和基于n-gram的语义消歧方法。采用这种方法对文档进行语义标注,将标注结果持久化为语义索引,为实现语义信息检索提供基础。针对构建的测试数据集,进行的标注实验表明该方法能够依据本体知识库,有效地对Web文档进行自动语义标注。相似文献

9.

BFS-CTC汉语句义结构标注语料库 总被引：3，自引：0，他引：3

刘盈盈罗森林冯扬韩磊陈功王倩《中文信息学报》2013,27(1):72-81

句义结构分析是汉语语义分析中不可逾越的重要环节,为了满足汉语句义结构分析的需要,基于现代汉语语义学理论构建了一种层次化的汉语句义结构模型,定义了标注规范和标记形式,建设了一个汉语句义结构标注语料库BFS-CTC(Beijing Forest Studio-Chinese Tagged Corpus)。标注内容方面,基于句义结构模型的定义标注了句义结构句型层、描述层、对象层和细节层中所包含的各个要素及其组合关系,包括句义类型、谓词及其时态、语义格类型等信息,并且提供了词法和短语结构句法信息,便于词法、句法、句义的对照分析研究;语料库组织结构方面,该语料库包括四个部分,即原始句子库、词法标注库、句法标注库和句义结构标注库,可根据研究的需要,在词法、句法、句义结构标注的基础上进行深加工,在核心标注库的基础上添加更多具有针对性的扩展标注库,利用句子的唯一ID号进行识别和使用;语料来源和规模方面,语料全部来自新闻语料,经过人工收集、整理,合理覆盖了主谓句、非主谓句、把字句等六种主要句式类型,规模已达到10 000句。同其他语义标注库相比,BFS-CTC基于现代汉语语义学,提供了多层次的句义结构标注信息,兼容进行了词法和语法标注,各类标注既可以单独使用也可综合使用进行横向分析,可用于自然语言处理多方面的研究,进一步推动汉语语义分析的研究和发展。相似文献

10.

汉语基本复合名词短语语义关系知识库构建与识别

张文敏李华勇邵艳秋《中文信息学报》2019,33(12):28-36

汉语复合名词短语因其使用范围广泛、结构独特、内部语义复杂的特点,一直是语言学分析和中文信息处理领域的重要研究对象。国内关于复合名词短语的语言资源极其匮乏,且现有知识库只研究名名复合形式的短语,包含动词的复合名词短语的知识库构建仍处于空白阶段,同时现有的复合名词短语知识库大部分脱离了语境,没有句子级别的信息。针对这一现状,该文从多个领域搜集语料,建立了一套新的语义关系体系,标注构建了一个具有相当规模的带有句子信息的基本复合名词语义关系知识库。该库的标注重点是标注句子中基本复合名词短语的边界以及短语内部成分之间的语义关系,总共收录27 007条句子。该文对标注后的知识库做了详细的计量统计分析。最后基于标注得到的知识库,使用基线模型对基本复合名词短语进行了自动定界和语义分类实验,并对实验结果和未来可能的改进方向做了总结分析。相似文献

11.

基于远监督的语义知识资源扩展研究

卢达威王星友袁毓林《中文信息学报》2016,30(6):147-155

语义知识资源蕴含了深刻的语言学理论,是语言学知识和语言工程的重要接口。该文以形容词句法语义词典为研究对象,探索对语义知识资源自动扩展的方法。该文的目标是利用大规模语料库,扩展原有词典的词表及其对应的句法格式。具体方法是根据词的句法格式将词典的词分类,将待扩展的新词通过分类器映射到原有词典的词中,以此把词典扩展问题转化为多类分类问题。依据的原理是词典词和待扩展新词在大规模语料中句法结构的相似性。该文通过远监督的方法构造训练数据,避免大量的人工标注。训练过程结合了浅层机器学习方法和深度神经网络,取得了有意义的成果。实验结果显示,深度神经网络能够习得句法结构信息,有效提升匹配的准确率。相似文献

12.

汉语未登录词的词义知识表示及语义预测

田元贺刘扬《中文信息学报》2016,30(6):26-34

在此前的汉语未登录词语义预测中,构词相关的知识一直被当做预测的手段,而没有被视为一种有价值的知识表示方式,该文在“语素概念”基础上,深入考察汉语的语义构词知识,给出未登录词的“多层面”的词义知识表示方案。针对该方案,该文采用贝叶斯网络方法,构建面向汉语未登录词的自动语义构词分析模型,该模型能有效预测未登录词的“多层面”的词义知识。这种词义知识表示简单、直观、易于拓展,实验表明对汉语未登录词的语义预测具有重要的价值,可以满足不同层次的应用需求。相似文献

13.

语义角色映射为句法成分的词汇语义制约规律及特点

亢世勇张晨《中文信息学报》2016,30(6):7-14

该文以联接理论、事件结构理论为指导,进行词汇语义类、语义角色、句法成分对应关系的研究。选择人教社中小学语文课文语料,标注语义角色、句法成分及中心词的词汇语义类。在标注语料库的基础上,统计分析了词汇语义类与语义角色的对应关系,重点分析各语义类语义角色映射为句法成分的规律,并进一步总结了各词汇语义类的语义角色与句法成分的对应的特点。尽管词汇语义类、语义角色、句法成分之间存在错综复杂的关系,但还是有规律的,可以为计算机句法分析提供一些依据。相似文献

14.

基于声调核参数及DNN建模的韵律边界检测研究

林举解焱陆张劲松张微《中文信息学报》2016,30(6):35-39

韵律边界对言语表达的自然度和可理解度有着重要作用。韵律建模也是语音合成、语音理解中的重要方面。该文从相邻声调的相互作用角度出发,提出基于深度神经网络(DNN)及声调核声学特征的汉语韵律边界检测方法。该方法首先采用声调核部分的声学特征来计算边界检测相关参数。然后,利用深度神经网络进行建模。作为对比,实验中采用了以整个音节的声学特征为输入特征的基线系统。结果表明,只使用调核部分声学特征的系统优于使用整个音节的系统,韵律边界检测正确率相对提高了4%,这表明该文提出的汉语韵律边界检测方法的有效性。相似文献

15.

基于文本语义离散度的自动作文评分关键技术研究

王耀华李舟军何跃鹰巢文涵周建设《中文信息学报》2016,30(6):173-181

该文尝试从文本语义离散度的角度去提升自动作文评分的效果,提出了两种文本语义离散度的表示方法,并给出了数学化的计算公式。基于现有的LDA模型、段落向量、词向量等具体方法,提取出四种表征文本语义离散度的实例,应用于自动作文评分。该文从统计学角度将文本语义离散度向量化,从去中心化的角度将文本语义离散度矩阵化,并使用多元线性回归、卷积神经网络和循环神经网络三种方法进行对比实验。实验结果表明,在50篇作文的验证集上,在加入文本语义离散度特征后,预测分数与真实分数之间均方根误差最大降低10.99%,皮尔逊相关系数最高提升2.7倍。该表示方法通用性强,没有语种限制,可以扩展到任何语言。相似文献

16.

基于Gate机制与BiLSTMCRF的汉语语义角色标注

张苗苗张玉洁刘明童徐金安陈钰枫《计算机与现代化》2018,(4):1

目前,语义角色标注大多基于双向长短时记忆网络（BiLSTM）。但是,由于词向量表示由上下文窗口中的词嵌入拼接得到,导致其依赖于左右词嵌入的联合作用。针对该问题,引入Gate机制对词向量表示进行调整。为了获取更深层次的语义信息,对BiLSTM的深度进行扩展。此外,引入标签转移概率矩阵进行约束,并且使用条件随机场（CRF）融合全局标签信息得出最优标注序列。实验结果表明,该方法使得汉语语义角色标注的F1值提高1.71%。相似文献

17.

基于语义角色标注的汉语句子相似度算法

田堃柯永红穗志方《中文信息学报》2016,30(6):126-132

在语义角色标注过程中,经常需要检索相似的已标注语料,以便进行参考和分析。现有方法未能充分利用动词及其支配的成分信息,无法满足语义角色标注的相似句检索需求。基于此,本文提出一种新的汉语句子相似度计算方法。该方法基于已标注好语义角色的语料资源,以动词为分析核心,通过语义角色分析、标注句型的相似匹配、标注句型间相似度计算等步骤来实现句子语义的相似度量。为达到更好的实验效果,论文还综合比较了基于知网、词向量等多种计算词语相似度的算法,通过分析与实验对比,将实验效果最好的算法应用到句子相似度计算的研究中。实验结果显示,基于语义角色标注的句子相似度计算方法相对传统方法获得了更好的测试结果。相似文献

18.

双语者加工汉语母语语义时对英语的ERP激活效应的研究

杨思琴江铭虎《中文信息学报》2016,30(6):117-125

本研究采用ERP实验,以被试的反应时间、错误率和脑电成分N400为参考因素,探索高级双语者在加工第一语言时是否自动检索第二语言。结果显示,内隐的英语首发音条件引起的效应没有体现在反应时间上。在ERP实验结果中,被试在判断语义相关的词语时,大脑语言区域的N400在词语英译首发音一致与否的情况下差异不显著;而判断语义无关的词语时,N400在该条件下显著。实验结果分析表明,高级双语者在深度加工第一语言时,大脑可能无意识地检索第二语言。相似文献

19.

基于框架语义的高考语文阅读理解答案句抽取

李国臣刘姝林杨陟卓李茹张虎钱揖丽《中文信息学报》2016,30(6):164-172

高考语文阅读理解问答相对普通阅读理解问答难度更大,问句抽象表述的理解需要更深层的语言分析技术,答案候选句抽取更注重与问句的关联分析,答案候选句排序更注重答案句之间的语义相关性。为此,该文提出借助框架语义匹配和框架语义关系抽取答案候选句,在排序时引入流形排序模型,通过答案句之间的框架语义相关度将排序分数进行传播,最终选取分数较高的Top-4作为答案句。在北京近12年高考语文阅读理解问答题上的准确率与召回率分别达到了53.65%与79.06%。相似文献

20.

基于DNN的汉语框架识别研究

赵红燕李茹张晟张力文《中文信息学报》2016,30(6):75-83

框架识别是语义角色标注的基本任务,它是根据目标词激起的语义场景,为其分配一个合适的语义框架。目前框架识别的研究主要是基于统计机器学习方法,把它看作多分类问题,框架识别的性能主要依赖于人工选择的特征。然而,人工选择特征的有效性和完备性无法保证。深度神经网络自动学习特征的能力,为我们提供了新思路。该文探索了利用深度神经网络自动学习目标词上下文特征,建立了一种新的通用的框架识别模型,在汉语框架网和《人民日报》2003年3月新闻语料上分别取得了79.64%和78.58%的准确率,实验证明该模型具有较好的泛化能力。相似文献