期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

李强袁毓林《中文信息学报》2015,29(5):9-20

该文主要讨论名词的词义描写和研究问题。首先通过对几种主要的词汇语义学理论(包括结构主义语义学、生成主义语义学、概念语义学和自然语义元语言理论)进行介绍和评述,指出它们在对名词进行语义刻画方面存在缺陷和不足;然后,重点引入生成词库理论的物性结构的描写方式,阐明它与前几种理论的区别及其自身的特点;最后,在生成词库理论的基础上,展示物性结构知识在有关名词分析中的四个研究案例(词语缺省、隐喻义生成、供用句、中动句)和在自然语言处理中的可能应用。相似文献

2.

基于概念层次网络的知识表示与本体建模

文亮李娟刘智颖晋耀红《中文信息学报》2018,32(4):66-73

知识表示是自然语言理解的重要基础。知识表示不统一、语义信息无法系统化利用是目前存在的亟待解决的问题。要解决这个问题,就要解决语义知识表示的问题。该文基于概念层次网络,描述了词语、句子和篇章层面的语义知识表示方法。基于文中描述的词汇层面的表示方法,构建了一个多语言本体知识库。该知识库的知识表示方法不仅可以为知识表示理论研究提供基础,还可以为自然语言处理相关领域的应用提供资源支持。相似文献

3.

基于概念特征的汉语交互类言说动词语义分析及同义词群的建构

肖珊郭婷婷《中文信息学报》2013,27(6):69-75

人工智能的最重要内容之一是自然语言处理,建设词汇语义知识库是语言信息处理技术取得进步的重要保障。目前国内外基于同义词群(Synset)的词网研究存在结构不甚严谨,语义颗粒度不够精细,应用范围比较有限的问题。以“词群—词位”变体理论为基础建立多维特征概念语义网(Multi-D WordNet)是对这些问题进行解决的有效尝试,通过分析与描写基本词位(概念本体)与变体之间、变体与变体之间的关系,找出概念属性的差异,从而构建颗粒度更为精细的同义词群。言说动词的次范畴类“交互类”动词可作为研究个案,初步用来探讨这类典型词的语义结构及词群系统的建构规律。相似文献

4.

怎样利用语言知识资源进行语义理解和常识推理

袁毓林卢达威《中文信息学报》2018,32(12):11-23

该文讨论怎样利用语言知识资源来帮助机器进行语义理解和常识推理。首先,指出人类生活在常识和意义世界中,人工智能机器人必须理解自然语言的意义,能够在此基础上进行常识推理。接着,简单梳理了基于知识和基于统计两种自然语言处理路线各自的优长和短缺。然后,说明完全绕开知识的统计方法和深度学习,都不能真正理解概念和语言。该文通过具体案例说明,《实词信息词典》已经配备了有关词项的语义角色关系及其句法配置信息;把这种语言知识加入知识图谱和内容计算中,可以为人工智能提供理解和解释从而造就一种可解释的人工智能。由于“物性角色”描述了名词所指事物的百科知识,可用以回答相关事物是什么(形式角色)、有哪些部件(构成角色)、用什么做的(材料)、怎么形成的(施成)、有什么用途(功用)等常识性问题。相似文献

5.

蒙古语语言知识库的建立与应用

那顺乌日图《中文信息学报》2011,25(6):162-166

建立一个较为完整的、能够为自然语言处理系统提供知识支撑的语言知识库是蒙古文信息处理当务之急。目前蒙古语语言知识库建设已取得阶段性成果,知识库已初具规模,但也仍然存在一些亟待解决的理论和技术问题。该文对蒙古语语言知识库的主要结构和内容,蒙古语语言知识库的应用,尚待解决的问题进行介绍和探讨。相似文献

6.

基于生成词库论和论元结构理论的语义知识体系研究

袁毓林《中文信息学报》2013,27(6):23-31

该文讨论如何构造合适的汉语语义描写体系并建设相应的语义知识库,从而为文本语义的计算机自动分析提供可靠的资源。文章提出的技术路线是在生成词库论和论元结构理论的指导下,分别描写名词的物性结构和动词、形容词的论元结构(包括物性角色或论元角色集合及其句法配置格式集合),标定名词、动词和形容词的情感评价色彩,揭示相关名词、动词和形容词的物性角色和论元角色之间的关联和推导关系,从而形成比较完整的关于名词、动词和形容词的实体指称、概念关系和情感评价等多层面的语义知识。最后,还展示了这种多层面的语义知识在语义自动计算中的运用案例。相似文献

7.

基于配价的维吾尔语框架语义知识库的构建

吾买尔江·库尔班阿里甫·库尔班《中文信息学报》2007,21(6):36-42

本文阐述了以配价作为基本描写法、真实语料为事实依据的维吾尔语框架语义知识库(简称框架网FrameNet)的构建,该知识库在构建维吾尔语词汇及其所属框架的语义词典等诸多领域有着广阔的应用空间和发展前景。提出了研究维吾尔语中句法功能和概念结构(也就是语义结构) 之间的关系, 以及建立用于自然语言处理的维吾尔语网上词汇知识库的意义。在维吾尔语的研究中引入了框架语义知识库(框架网)。框架语义知识库作为一种网上词汇语料库, 包括对每个词位( lexeme)的各个涵义的句法、语义信息的详尽描述。本文为维吾尔语框架语义知识库中各个框架元素的句法、语义特征的说明等自然语言信息处理研究提出新的研究思路,对基于配价的维吾尔语框架语义知识库构建的方法进行了探讨。相似文献

8.

词汇计量研究与常用词知识库建设

俞士汶朱学锋《中文信息学报》2015,29(3):16-20

面向自然语言处理的词汇语义研究应该以词汇的计量研究为基础。该文在评述汉语词汇计量研究的主要成果以后,提出一个汉语常用词知识库的建设任务,并给出常用词表的构造性定义、词表常用性的定量评价方法以及“部件词”的概念,最后介绍现代汉语常用词知识库的总体设计和已经做的工作。期望常用词知识库的建设能为汉语词汇语义学研究、为中文信息处理事业的发展做出贡献。相似文献

9.

电子词典与词汇知识表达 总被引：3，自引：0，他引：3

陈克健《中文信息学报》2002,16(4):2-12

词汇知识的表达与取得是自然语言处理极须克服的问题,本论文提出一个初步的架构与常识的抽取机制。语言处理系统是以词为讯息处理单元,登录在词项下的讯息可以包括统计、语法、语义、常识等。语言分析系统利用〈词〉为引得取得输入语句中相关词汇的语法、语义、常识等信息,让语言处理系统有更好的聚焦能力,可以藉以解决分词歧义、结构的歧义。对于不易以人工整理取得的常识,本论文也提出计算机自动学习的策略,以渐进式的方式累积概念与概念之间的语义关系,来增进语言系统的分析能力。这个策略可行的几个关键技术,包括(1)未登录词判别及语法语义自动分类, (2)词义分析, (3)应用语法语义及常识的剖析系统。相似文献

10.

综合型语言知识库的建设与利用 总被引：15，自引：4，他引：15

俞士汶段慧明朱学锋张化瑞《中文信息学报》2004,18(5):2-11

语言知识库的规模和质量决定了自然语言处理系统的成败。经过18年的努力,北京大学计算语言学研究所已经积累了一系列颇具规模、质量上乘的语言数据资源:现代汉语语法信息词典,大规模基本标注语料库,现代汉语语义词典,中文概念词典,不同单位对齐的双语语料库,多个专业领域的术语库,现代汉语短语结构规则库,中国古代诗词语料库等等。本项研究将把这些语言数据资源集成为一个综合型的语言知识库。集成不同的语言数据资源时,必须克服它们之间的“缝隙”。规划中的综合型语言知识库除了有统一的友好的使用界面和方便的应用程序接口外,还将提供支持知识挖掘的工具软件,促使现有的语言数据资源从初级产品形式向深加工产品形式不断发展;提供多种形式的知识传播和信息服务机制,让综合型语言知识库为语言信息处理研究、语言学本体研究和语言教学提供全方位的、多层次的支持。相似文献

11.

词义消歧研究的现状与发展方向

李生张晶《计算机科学》2001,28(9):95-98

1 词义消歧及其应用词义是词汇在一定的语言环境下反映的特定语言现象。它能够明确地表达该词汇在该语境下表达的语义属性如感知、行为和情绪等;表达该词汇与相关词汇之间的关系;并且表达该词汇所特有的知识及常识性的知识。透过词义,人们将能运用自己的思维描述该语言现象,对其进行推理,或者为指代词从上下文中找到指代物。在自然语言中,一个词汇往往存在多个词义,称为词的多义性。例如:Bank有“银行”、“河岸”的意思。但是当词汇处于一定的语言环境,则只有唯一的意思。例如;“He slipped down the bank”中,bank的意思是“河岸”。词义消歧就是使计算机自动为词汇选择正确意思,是自然语言处理领域中词汇级别上的最大难题。词义消歧不是自然语言处理的最终目的,而是自然语言处理中不可缺少的一个环节。其应用至少包括下述领域: 相似文献

12.

基于跨语言语料的汉泰词分布表示

张金鹏周兰江线岩团余正涛何思兰《计算机工程与科学》2015,37(12):2358-2365

词汇的表示问题是自然语言处理的基础研究内容。目前单语词汇分布表示已经在一些自然语言处理问题上取得很好的应用效果,然而在跨语言词汇的分布表示上国内外研究很少,针对这个问题,利用两种语言名词、动词分布的相似性,通过弱监督学习扩展等方式在中文语料中嵌入泰语的互译词、同类词、上义词等,学习出泰语词在汉泰跨语言环境下的分布。实验基于学习到的跨语言词汇分布表示应用于双语文本相似度计算和汉泰混合语料集文本分类,均取得较好效果。相似文献

13.

现代汉语形容词资源库的构建

饶琪王厚峰汪梦翔李慧《中文信息学报》2018,32(4):50-58

形容词与名词、动词构成汉语实词的主体组成部分,在句法上表现出对“名词”的极度依赖,其核心功能是在概念层面上,在认知注意机制的调适作用下对名词的特征进行“评价”。该文主要叙述汉语形容词知识库构建的相关工作。首先是考察已有的形容词的收词情况,并结合语言演变中新产生的形容词,构建了一个较为全面的形容词词集;其次是详细阐述知识库的构建理念;再次是具体阐述知识库的特征描述体系;最后是对该知识库的应用场景进行展望。相似文献

14.

词汇知识获取及语义计算平台的构建

刘兴林《计算机与现代化》2013,(3):85-88

设计并实现一个词汇知识获取及语义计算平台VKASCP,以及自然语言处理所需要的基础功能模块。系统主要功能模块包括合成词识别、合成词词性标注及分词修正、主题词提取、词汇语义计算,以及基于主题词集的自动文摘和文本相似度计算。VKASCP融文本语料库、词汇知识库于一体,为词汇知识获取及语义计算提供了一个良好的研究平台,并为今后构建词汇语义知识库打下了坚实的基础。相似文献

15.

基于HowNet的航空术语语义知识库的构建

张桂平刁丽娜王裴岩《中文信息学报》2014,28(5):92-101

语义知识库的构建是自然语言处理基础性工作,对于语言信息的处理有重要的作用,但面向特定领域的语义知识库的构建还是一个难点。该文在分析了航空术语的基本特点的基础上,根据HowNet和KDML描述语言构建了面向航空领域的术语语义知识库,并在构建航空术语知识库的过程中总结形成了构建航空术语知识库的基础规则、动态角色/特征的选择规则。在文章最后对所构建的术语进行了相似度的计算,取得了较好的结果。相似文献

16.

一种基于大知识库的亲属关系自动推理模型

陈振宇袁毓林张秀松周强《中文信息学报》2010,24(3):117-124

我们采用“大知识库—小运算”的技术路线,提出一个汉语亲属关系的自动推理模型。首先,在充分研究汉语亲属关系的词汇—语法表达的基础上,给汉语常见的亲属关系及其情景语义建立认知模型。然后,据此构造大型的汉语亲属关系知识库,包括外围知识库和核心知识库两种。前者详尽列举亲属名词和称呼动词所涉及的各种句式,并给出相应的语义表达式;后者包括三个子库性质库(刻画亲属关系中的性别、长幼等属性)、逆判断库(刻画“父—子”等反对称关系对子)和传递库(刻画通过中介人把称呼人与被称呼人联系起来的各种路径,共计3 600余条)。在此基础上,形成了一个汉语亲属关系自动推理模型,可以在已知ABC三边关系的任意两边时快速地推导出未知的另一边关系。相似文献

17.

面向中文自然语言文档的自动知识抽取方法

车海燕冯铁张家晨陈伟李大利《计算机研究与发展》2013,50(4)

自动知识抽取方法可以自动识别并抽取Web文档中与本体匹配的事实知识.利用这些事实知识既可以构建基于知识的服务,也能够为语义Web的实现提供必要的语义数据.但面向自然语言特别是中文自然语言的自动知识抽取非常困难.提出了基于语义Web理论和中文自然语言处理(naturallanguage processing,NLP)技术的自动知识抽取新方法AKE,用聚集体知识概念刻画N元关系知识,能够在不使用大规模语言知识库和同义词表的情况下自动识别中文自然语言文档内容中显式和隐含的简单事实知识和N元关系复杂事实知识.实验结果表明该方法优于目前已知的其他方法. 相似文献

18.

基于本体的领域知识库构建方法研究

王文璞林木辉《福建电脑》2008,24(8):131-132

领域知识库的构建有利于知识的检索和共享。本文首先分析了现有教学支持系统存在的问题,指出构建基于本体的知识库是一种解决存在问题的有效方法;接着,介绍了构建基于本体的知识库的一般步骤,并通过构建《C语言程序设计》课程知识库进行呈现。相似文献

19.

知识工程学与化学研究

陈念贻《计算机与应用化学》1984,(1)

一、关于知识工程学“知识工程学”(Knowledge Engineering)这一名词是1977年Stanford大学教授Feigenbaum提出的。按照他们的解释:知识工程学是以人工智能的原理和方法,解决需要专门知识的困难问题的技术。六十年代以来,随着学术研究和社会活动的发展,各种信息(情报)的收集、管理、流通和利用的工作日益复杂和庞大。根据实际需要,人们将同类数据集中用计算机贮存、管理,形成称为“数据库”的系统。“知识库”(Knowledge base)是数据库的进一步相似文献

20.

基于特征词关联性的同义词集挖掘算法* 总被引：2，自引：0，他引：2

陈建超郑启伦李庆阳严桂夺《计算机应用研究》2009,26(7):2517-2519

一词多义和多词同义是语言中广泛存在的现象,它给自然语言处理带来了很多困难,解决这个难题的有效办法是建立包含上下文信息的同义词集。深入分析了概念、词汇和特征词三者的内在关系,并在此基础上提出了一种基于同义词汇的特征词的关联性,从文本中挖掘同义词集的算法。根据特征词之间存在关联性的特点,算法以成熟的关联规则挖掘算法作为基础,获得了明显优于同类算法的实验效果。算法获得的同义词集附带上下文信息,可有效解决文本中词汇的多义性和同义性问题。相似文献