首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 93 毫秒
1.
基于可拓学理论的汉语词义消歧   总被引:1,自引:0,他引:1  
卢志茂  刘挺  李生 《哈尔滨工业大学学报》2006,38(12):2026-2029,2035
应用可拓学原理,对歧义词进行可拓分解、可拓置换等可拓变换,为歧义词的各个词义建立相应的可拓集合,利用可拓集合中义原词语从大规模语料中自动获取歧义词的语言信息,建立无指导的词义消歧模型.该方法克服了从无词义标注语料中获取词义消歧知识的难题.实验证明,该方法用于汉语的词义消歧切实可行,平均正确率达到90.16%.  相似文献   

2.
词义消歧是计算语言学领域的基础性关键研究课题。本文介绍了与词义消歧相关的一些重要术语概念,包括词义消歧、词义区分、基于词典的词义消歧方法、有监督的词义消歧方法、词义标注语料库等。  相似文献   

3.
为了提高词义消歧性能,提出了一种基于卷积神经网络的消歧方法.以歧义词为中心,向左右两侧连续扩展4个邻接词汇单元,选取其中的词形、词性和语义类作为消歧特征.以消歧特征为基础,使用卷积神经网络来确定歧义词的语义类别.利用SemEval-2007:Task#5的训练语料和哈尔滨工业大学语义标注语料来优化卷积神经网络.使用SemEval-2007:Task#5的测试语料来测试词义消歧分类器的性能,所提方法的消歧平均准确率有提高.实验结果表明,该方法在词义消歧中是可行的.  相似文献   

4.
针对汉语一词多义现象,根据上下文所蕴含的语言学知识,采用受限玻尔兹曼机(restricted boltzmann machine,RBM)来确定歧义词汇的真实含义。选取歧义词汇左右邻接的四个词单元中的词形、词性和语义类作为消歧特征。同时,使用RBM来构建词义消歧模型。结合SemEval-2007:Task#5的训练语料和哈尔滨工业大学的语义标注语料来优化RBM的参数。利用SemEval-2007:Task#5的测试语料对词义消歧模型进行测试。实验结果表明:相对于贝叶斯词义消歧分类器而言,受限玻尔兹曼机词义消歧方法的消歧准确率有所提高。  相似文献   

5.
针对已有的词义消歧研究方法的不足,在分析了多种不同结构知识词典的可计算性及其计算复杂度之后,选择北大计算语言所的《现代汉语语法信息词典》和《现代汉语语义词典》,并结合已经标注了词义的人民日报语料作为词义消歧知识源,从中获取汉语词义消歧所需要的统计知识和规则知识,并采用统计与规则相结合的方法构建词义消歧模型,取得了比较满意的词义消其效果.  相似文献   

6.
刘挺  卢志茂  李生 《哈尔滨工业大学学报》2005,37(12):1603-1605,1649
为研究在给定上下文中如何确定多义词的词义,介绍了一种无指导的词义消歧技术和一个汉语全文词义标注系统的设计实现过程.该系统基于贝叶斯模型,使用大规模语料进行训练,较好地解决了知识获取中数据稀疏的问题.该系统具有标注正确率高和运行速度快等特点,适合大规模文本的词义标注工作.  相似文献   

7.
作为自然语言处理的一项基础性研究,词义消歧对机器翻译、信息检索、文本分类、情感分析等上层应用有重要影响。本文针对现有消歧方法中存在的对知网知识利用不充分问题,提出了一种基于How Net的图模型词义消歧方法。该方法利用依存句法分析获取上下文知识,构建上下文消歧图,并对How Net中有着重要词义区分能力的例句进行依存句法分析,构建依存消歧图,结合上下文消歧图和依存消歧图完成歧义词的消歧处理。实验结果表明,该方法在Sem Eval-2007 task#5数据集上取得了0.468的消歧准确率,获得优于同类方法的消歧效果。  相似文献   

8.
词义消歧一直是信息检索领域的关键问题和难点之一。统计学方法以其良好的词义消歧效果逐渐占据主流地位。文章结合义类词典HowNet,分别采用隐马尔可夫模型,贝叶斯模型,基于依存关系改进贝叶斯模型对大规模真实文本进行了词义消歧研究,其中基于依存关系改进贝叶斯模型的词义消歧效果最好。  相似文献   

9.
词义消歧一直是信息检索领域的关键问题和难点之一。统计学方法以其良好的词义消歧效果逐渐占据主流地位。文章结合义类词典HowNet,分别采用隐马尔可夫模型,贝叶斯模型,基于依存关系改进贝叶斯模型对大规模真实文本进行了词义消歧研究,其中基于依存关系改进贝叶斯模型的词义消歧效果最好。  相似文献   

10.
针对当前FrameNet框架下的词义消歧准确率较低的问题,采用卷积神经网络应用于FrameNet框架进行框架消歧研究.该模型依托依存句法分析树排序选出待消歧词的6个邻接单词节点,并选择单词词义、父节点词义、单词词性、单词依存分析类型作为消歧特征,使用Softmax函数作为全连接层分类器,通过输出待消歧词可激活的各框架概率选出概率值最高的作为激活框架,从而判定待消歧词词义.实验结果表明,该模型在FrameNet框架的消歧准确率较高于条件随机场等其他普遍算法,各目标词的准确率较为稳定,通过该模型切实提升了FrameNet框架消歧的准确率.  相似文献   

11.
词义消歧和词义消歧评测简介   总被引:1,自引:0,他引:1  
词义消歧是自然语言处理的基础研究之一。本文简要地介绍了词义消歧的研究目的、研究内容、研究方法(特别是基于机器学习的方法)和研究历程,以及当前词义消歧所面临的主要问题;接下来比较详细地介绍词义消歧相关的国际评测。最后对全文做出总结。  相似文献   

12.
词义消歧(WSD)一直是自然语言理解中的一个关键问题,该问题解决的好坏直接关系到自然语言处理中诸多应用问题的效果优劣。本文对大规模真实文本进行了词义消歧研究,采用了基于依存分析改进贝叶斯分类模型的有指导词义消歧方法。  相似文献   

13.
韩国语的词汇教学是教学中的中心任务。韩国词汇分为固有词、汉源词、外来词和混合词。教学方法包括引申构词法、派生法等,使学生更加全面系统地掌握所学单词,且较容易地把新接触的生词用于交际中去。  相似文献   

14.
从范畴词、修饰词方面说明了过度冗余在汉英翻译中的种种具体表现,认为译文冗余过度与汉英语言结构差异、词义的非对应性、文化和思维方式差异、翻译技巧等诸多因素有关。针对翻译中普遍存在的过度冗余问题,提出省译(omission)是消除该现象的一种有效方式。  相似文献   

15.
统计与神经网络相结合的词义消歧模型   总被引:4,自引:0,他引:4  
介绍了一种基于BP神经网络和统计方法相结合的有导词义消歧模型,阐述了BP神经网络原理,通过对使用这种混合人工智能的消歧模型的可能性和优越性进行了讨论,最后通过试验发现实际和预测结果的误差并不随着试验迭代次数而递减,而是实际误差随着次数的增加在零的附近呈现波动状态,即使用很少的迭代次数也可以得到比较好的结果。  相似文献   

16.
0 INTRODUCTIONThetaskofwordsensedisambiguationistoassignasenseofapolysemouswordtoaspecificcontext.Itisjustapieceofcakeformostofus .Butevennowadays,thistaskistoohardforacomputertofindanappliedmethodforrealapplications.Itisnowanderthatsomeresearchersnamed…  相似文献   

17.
英文文本识别系统中单词切分效果直接影响系统识别准确率.提出一种有效利用单词中的连通域以实现单词切分的方法,该方法首先对给定的图像文件进行扫描,搜索图像中所存在的所有连通域,然后根据连通域的坐标、尺寸等影响因素,对有效的连通域进行合并,并过滤掉噪声等因素所产生的连通域碎片,以实现有效的英文单词区域的正确分割,从而实现英文单词的正确切分.实验结果表明,针对相同的英文文本图像,该方法对英文单词切分的准确率达95%以上,与垂直投影切分法最高准确率27%相比有较大幅度的提高,证明该方法可以很好解决垂直投影法无法解决的字母之间相互交迭的单词切分问题.  相似文献   

18.
生物信息技术术语标准化研究   总被引:1,自引:0,他引:1  
首先论述了生物信息技术的概念和研究范围,进而从多学科交叉融合的角度简要总结和分析了生物信息技术术语发展的特点和趋势,以及在术语规范化方面存在的相关问题,然后参考和借鉴了统一医学语言系统(UMLS)对此类问题的解决思路,提出了术语翻译标准化的具体建议。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号