首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 156 毫秒
1.
该文以现代汉语(特别是网络搜索词)中的名名组合为主要研究对象,探索一种基于规则的汉语名名组合的自动释义方法。其研究步骤为: (1)利用《现代汉语语义词典》中名词的语义类别,来建立名名组合的语义类组合模式;(2)在“生成词库论”中物性角色思想的指导下,用名名组合中某个名词的施成角色或功能角色作为释义动词,来揭示这两个名词之间的语义关系;(3)以语义类组合模式为单位构建名名组合的释义模板,并汇集成名名搭配数据库;(4)利用《知网》资源,来获取具体名词的施成角色和功能角色,建立汉语名词知识库。在这两个数据库的基础上,我们初步实现了一个汉语名名组合的自动释义程序。  相似文献   

2.
该文在南京师范大学语言科技研究所《元语言研究》项目组的研究成果上,对其建构的释义元语言系统进行简单介绍并通过软件对《释义元语言词表》、《现汉受限词汇表》、《释义元语言微型词典》等若干词表作了查询、增补、修改等一系列功能,以完成对释义元语言和释义词的完善工作。  相似文献   

3.
《汉语图解词典》系国家汉办招标项目,是一本供外国人学习汉语的工具书。该词典利用语义关联模式,将汉语词语分15个主题,142个话题,以大量直观的图片来解释4200余条词语,涵盖社会生活真实场景中的常见元素。在图中相应的位置标出序号,配以简体汉字、拼音和英语释义。除名词、动词、形容词外,还收录大量词组,方便学习者全方位掌握汉语词汇。  相似文献   

4.
复合名词短语的语义解释的主要目的是恢复修饰语和中心词之间隐含的语义关系。该文针对汉语复合名词短语的语义解释,首次采用动态的策略,提出了“基于动词的短语释义”的方法,利用语料库及Web数据,自动获取复合名词短语的释义短语,实验结果表明,该方法不仅可以为复合名词短语提供多种可能的语义解释,而且能够反应相似的复合名词短语之间细微的语义差别。此外,该文的研究结果可以服务于问答系统、信息检索、词典编纂等多个应用领域。  相似文献   

5.
针对维汉机器翻译中单个翻译模型翻译效果差且多个翻译模型间翻译差异较大的问题,提出一种基于释义信息的系统融合方法。通过提取汉语端释义信息对汉语翻译假设进行词对齐,利用词对齐信息构建并解码混淆网络,从而得到维汉机器翻译系统融合结果。实验结果表明,与单个翻译系统HPSTW相比,该方法能够有效提高翻译质量。  相似文献   

6.
基于子类的汉语动词SCF获取回退   总被引:1,自引:0,他引:1  
研究证明基于动词子类的回退方法能够改进次范畴化(SCF)自动获取的性能,不同的子类划分方法起到重要的作用。本文利用《同义词词林》、《知网1.2版》和《现代汉语动词大词典》分别对30个测试动词进行分类,并以分类结果来改进汉语动词SCF自动获取的性能,实验结果证明:一、回退后的获取性能有了较为明显的提高;二、涉及句法成分较多的分类方法更适合汉语SCF自动获取;三、随机组合相关动词来构造回退子类是不合理的;四、上述分类都不是适合汉语动词SCF获取回退的最优方法。  相似文献   

7.
针对射频识别(RFID)读写器和标签的《射频识别读写器通用技术规范》、《无源射频标签通用技术规范》系列技术规范的制定与发布已近一年时间,为了更好地发挥这些规范的作用,中国自动识别技术协会组织编写了与之相对应的《射频识别读写器通用技术规范释义》(按频率分为两部分)和《无源射频标签通用技术规范释义》,本文对这一系列"规范"和"释义"的制定和内容加以解读,但限于篇幅,本文只能加以导读性介绍,一斑不能窥见全豹,强烈推荐感兴趣的读者阅读这些规范和释义的全文。相信能为读写器和无源射频标签产品的设计和制造、测试和试验、应用和贸易相关企业和用户提供有价值的参考。  相似文献   

8.
动词语义角色一直是国内外语言学界研究的重点和难点。在自然语言处理领域,相关的语言资源也在逐步构建。对于汉语而言,国内大部分工作集中在语义角色标注上。该文创造性地提出了一种三元搭配的动词语义角色知识表征形式,并在前人研究的基础上,提出了一套语义角色分类体系。在该体系指导下,对汉语动词进行了穷尽式的语义角色认定及相关知识加工,以构建汉语动词语义角色知识库。截至目前,该工程考察了5 260个动词,加工了语义角色及引导词的动词数量为2 685个,加工认定语义角色4 307个。  相似文献   

9.
《宋书》是研究魏晋南北朝时期复音形容词的重要语料。从语义上,采用同义联合、近义或类义联合、反义联合和平行联合; 在词性上,采用名词+ 名词、形容词+ 名词、名词+ 形容词、形容词+ 形容词、动词+ 形容词、形容词+ 动词等构成形容词。其复 音形容词发展趋势是魏晋南北朝时期汉语词汇复音化程度进一步加深,单音形容词向半自由语素的演变,体现出魏晋南北朝时 期复音化水平的提高。其复音形容词产生的内部原因是中古时期是汉语复音化的加速时期,外部因素首先是社会的不断发展使 汉语词汇复音化,其次是中古时期骈骊文风的盛行,民族融合与佛教用语的广泛传播促进了大量复音词产生。  相似文献   

10.
现代汉语对“交际”的释义是“人与人之间的交往,或人际往来”。“交际”一词的英语是communication,动词是communicate。Longman Dictionary of Contemporary  相似文献   

11.
识别谓语动词是理解句子的关键。由于中文谓语动词结构复杂、使用灵活、形式多变,识别谓语动词在中文自然语言处理中是一项具有挑战的任务。本文从信息抽取角度,介绍了与中文谓语动词识别相关的概念,提出了一种针对中文谓语动词标注方法。在此基础上,研究了一种基于Attentional-BiLSTM-CRF神经网络的中文谓语动词识别方法。该方法通过双向递归神经网络获取句子内部的依赖关系,然后用注意力机制建模句子的焦点角色。最后通过条件随机场(Conditional random field, CRF)层返回一条最大化的标注路径。此外,为解决谓语动词输出唯一性的问题,提出了一种基于卷积神经网络的谓语动词唯一性识别模型。通过实验,该算法超出传统的序列标注模型CRF,在本文标注的中文谓语动词数据上到达76.75%的F值。  相似文献   

12.
张瑶  黄德根 《计算机工程》2011,37(19):150-152
英语动词正确汉译是机器翻译的难点.为此,提出一种基于动词语义模式库、固定句式库和变量库的英语动词汉译算法.介绍语义模式的提取方法,构建常用动词的语义模式库、固定句式库和变量库,归纳动词语义模式的3种结构形式:V语义模式,VO相邻语义模式和VO非相邻语义模式.动词语义模式库由上述3种结构形式对应的模式库构成.实验结果表明...  相似文献   

13.
肖升  何炎祥 《计算机科学》2012,39(5):161-164,176
为将动词与其论元间的约束规则应用于事件抽取,在事件模型中引入动词论元结构形成模型变体,围绕模型变体提出基于动词论元结构的中文事件抽取方法。此方法首先对待抽取文本进行预处理和句法分析,得出其语法结构;然后将所得结构与动词论元结构属性进行比较,找出每个动词支配的论元;最后利用论元的语义属性确定与之对应的事件特征并由此完成事件抽取。实验结果显示,此方法能有效提高抽取系统的性能和效率。  相似文献   

14.
A common practice in operational Machine Translation (MT) and Natural Language Processing (NLP) systems is to assume that a verb has a fixed number of senses and rely on a precompiled lexicon to achieve large coverage. This paper demonstrates that this assumption is too weak to cope with the similar problems of lexical divergences between languages and unexpected uses of words that give rise to cases outside of the pre-compiled lexicon coverage. We first examine the lexical divergences between English verbs and Chinese verbs. We then focus on a specific lexical selection problem—translating Englishchange-of-state verbs into Chinese verb compounds. We show that an accurate translation depends not only on information about the participants, but also on contextual information. Therefore, selectional restrictions on verb arguments lack the necessary power for accurate lexical selection. Second, we examine verb representation theories and practices in MT systems and show that under the fixed sense assumption, the existing representation schemes are not adequate for handling these lexical divergences and extending existing verb senses to unexpected usages. We then propose a method of verb representation based on conceptual lattices which allows the similarities among different verbs in different languages to be quantitatively measured. A prototype system UNICON implements this theory and performs more accurate MT lexical selection for our chosen set of verbs. An additional lexical module for UNICON is also provided that handles sense extension.  相似文献   

15.
该文吸收已有动词研究的相关成果,提出了动词语义词典开发的相关原则和研制思路,界定并描写了词典中所涉及的相关属性信息,并对词典的总体文件结构及其各个库的信息进行了描写和说明。最终开发了融合词汇语义和句法语义,涵盖词形、词性、释义、义类、义场、句法范畴信息、语义范畴信息、语义句模等多种信息参数的开放性的动词语义知识词典。该词典可以在歧义分化、词义关系考察、句法—语义接口、句模抽取等方面提供支持。  相似文献   

16.
刘小军  赵栋  姚卫东 《计算机仿真》2007,24(12):312-314
为了提高搜索引擎的检索效率以及加强知识产权保护,结合汉语语言学以及自然语言处理的研究成果,提出了一种用于中文文本查重的算法.通过引入"动词中心词"的概念,扩展停用词的范围,将文本中的部分动词组成动词序列作为文本特征串,结合串匹配算法,计算出中文文本间语法相似性.同时根据IFIDF方法提取文本特征并进行权重计算,计算出中文文本间的语义相似性.结合文本间语法相似性和语义相似性得到文章的相似度,可以判断两篇中文内容的相似性,有效地进行重稿检测.  相似文献   

17.
基于概念层次网络(HNC)理论,对多动词出现的一种情况——动词连见,进行了分类研究,给出了相应的处理规则。同时,还提出了一种基于BNF范式和产生式规则的形式化规则描述语言,完成了对规则的形式化描述和软件实现。在此基础上,对真实语料中出现动词连见的语句进行了计算机自动处理,给出了处理结果。  相似文献   

18.

Human–Object Interaction (HOI) detection is important to human-centric scene understanding tasks. Existing works tend to assume that the same verb has similar visual characteristics in different HOI categories, an approach that ignores the diverse semantic meanings of the verb. To address this issue, in this paper, we propose a novel Polysemy Deciphering Network (PD-Net) that decodes the visual polysemy of verbs for HOI detection in three distinct ways. First, we refine features for HOI detection to be polysemy-aware through the use of two novel modules: namely, Language Prior-guided Channel Attention (LPCA) and Language Prior-based Feature Augmentation (LPFA). LPCA highlights important elements in human and object appearance features for each HOI category to be identified; moreover, LPFA augments human pose and spatial features for HOI detection using language priors, enabling the verb classifiers to receive language hints that reduce intra-class variation for the same verb. Second, we introduce a novel Polysemy-Aware Modal Fusion module, which guides PD-Net to make decisions based on feature types deemed more important according to the language priors. Third, we propose to relieve the verb polysemy problem through sharing verb classifiers for semantically similar HOI categories. Furthermore, to expedite research on the verb polysemy problem, we build a new benchmark dataset named HOI-VerbPolysemy (HOI-VP), which includes common verbs (predicates) that have diverse semantic meanings in the real world. Finally, through deciphering the visual polysemy of verbs, our approach is demonstrated to outperform state-of-the-art methods by significant margins on the HICO-DET, V-COCO, and HOI-VP databases. Code and data in this paper are available at https://github.com/MuchHair/PD-Net.

  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号