首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
数量名短语的识别是识别由数量短语修饰的名词短语左右边界的研究.以往研究中,基于统计学习模型的数量短语识别方法依赖人工特征,需要通过专家知识构建知识库来实现对"数词+量词"短语的识别.本文在以往研究基础上纳入"名词"形成"数词+量词+名词"等八类数量名短语,并采用深度学习方法解决这一边界识别任务.通过BERT模型对原始文...  相似文献   

2.
根据英语名词短语的句法功能,提出了一种新的英语名词短语——功能名词短语,同时与基本名词短语和最长名词短语相比较.利用Google在线翻译系统,对存在结构歧义的句子进行了翻译,发现英汉机器翻译的错误主要是由结构歧义引起的,并应用功能名词短语的定义对结构歧义问题予以解决.实验结果表明,功能名词短语的识别能够有效消解两种结构歧义:一是与动词构成固定搭配的名词引起的歧义;二是"介词+名词"结构是作状语还是作后置定语的歧义.功能名词短语的研究对消除句法结构歧义、提高英汉机器翻译译文质量具有重要意义.  相似文献   

3.
最大熵和Brill方法结合识别英语BaseNPs   总被引:1,自引:0,他引:1  
为了进一步提高基本名词短语(BaseNPs)的识别精度,针对最大熵方法和Brill方法各自的特点,提出基于两者相结合的英语基本名词短语识别算法.该算法是在高准确率词性标注的基础上实现的.在训练和测试两个阶段中,均先采用最大熵方法识别基本名词短语,然后将已具有很高精度的识别结果作为初始标注结果运用于Brill方法中.实验结果表明,此联合算法达到了94%的准确率和召回率,充分融合了最大熵方法和Brill方法的优点,可与基于相同训练和测试语料的目前最理想的英语基本名词短语识别结果相比.  相似文献   

4.
为了进一步提高基本名词短语(BaseNPs)的识别精度,针对最大熵方法和Brill方法各自的特点,提出基于两者相结合的英语基本名词短语识别算法.该算法是在高准确率词性标注的基础上实现的.在训练和测试两个阶段中,均先采用最大熵方法识别基本名词短语,然后将已具有很高精度的识别结果作为初始标注结果运用于Brill方法中.实验结果表明,此联合算法达到了94%的准确率和召回率,充分融合了最大熵方法和Brill方法的优点,可与基于相同训练和测试语料的目前最理想的英语基本名词短语识别结果相比.  相似文献   

5.
中文信息处理是人工智能领域中的一个重要分支.中文自动分词是中文信息处理的基础.本文对自动分词现状及其几个技术难点做了一定的探讨,其中特别对自动分词中亟待解决的几个难题之一未登录名词短语识别的现状进行了分析.  相似文献   

6.
基于规则库和聚类分析的复句短语字段的自动识别研究   总被引:1,自引:0,他引:1  
复句层次结构与层次关系研究,是一项将中文信息处理由字、词处理阶段提升到句处理阶段的关键性难题.在研究复句层次划分和层次关系之前,首先要确定复句中分句的数量,需要排除其中非完整分句的字段(本文中称之为短语字段).结合语言学的相关理论,首先建立规则库,在此基础上,引入聚类分析法,对短语字段进行分类,最终使短语字段的自动识别率达到92.1%.  相似文献   

7.
为了建立一个面向中文信息处理的现代汉语复句深加工语料库,我们必须进行短语字段的自动识别工作.目的是把这些字段排除在分句层次分析的范围之外.这项工作建立在自动分词和词性标注的基础上,首先通过编写的程序把所有不含动词的字段暂时统一识别为短语字段.对于虽包含动词但前后有明显形式标志的字段则通过制定相应的规则来识别.还有一部分字段只包含一个动词,但前后却没有明显的形式标志,对此,需要利用字段中的结构助词"的"来帮助识别.  相似文献   

8.
提出一种基于最大熵模型的中文疾病命名短语识别方法,在模型特征选择上,将领域本体信息作为模型的一种特征.由此实现的疾病命名短语识别分类器具备有监督学习和利用领域知识的能力.实验结果表明,对于疾病命名短语识别的准确率达到89.7%,召回率87.6%,F-评价值88.64%.  相似文献   

9.
提出一种基于最大熵模型的中文疾病命名短语识别方法,在模型特征选择上,将领域本体信息作为模型的一种特征.由此实现的疾病命名短语识别分类器具备有监督学习和利用领域知识的能力.实验结果表明,对于疾病命名短语识别的准确率达到89.7%, 召回率87.6%, F-评价值88.64%.  相似文献   

10.
黄晓丹 《科技信息》2007,(15):396-397
英语短语动词词义丰富,搭配多变,是英语学习中的一个难点,同时也是现代英语的一个重要组成部分。本文从语法和语义角度入手,探讨了英语短语动词的分类及主要特征,希望对英语学习者有所帮助和启发。  相似文献   

11.
名词短语识别是自然语言处理领域的非常重要的子任务。利用最大熵法(ME)、支持向量机法(SVM)和隐马尔可夫模型(HMM)3种有代表性的统计方法对汉语文本进行名词短语识别,并对实验结果进行比较分析。结果表明HMM法在封闭测试中优势明显,SYM法在小样本模式的开放测试中表现良好,而最大熵方法在两种测试中的识别结果均比较理想。分析表明,HMM方法侧重应用在与线性序列相关的现象上;SVM方法适用于有限的汉语带标信息的分类问题;而最大熵方法特别适用于把不受限的文本特征加入统计模型中的情况。  相似文献   

12.
利用错误驱动法、支持向量机法和隐马尔可模型3种方法对汉语文本进行名词短语识别,对实验进行比较分析,结果表明SVM与HMM的识别效果总体上要好于错误驱动法,HMM法在封闭测试中优势明显.研究表明错误驱动法适用于解决从语料库中学习转换规则的传统问题;SVM方法适用于解决两类别的分类问题;而HMM方法侧重应用在与线性序列相关的现象上.  相似文献   

13.
基于统计和规则混合策略的中国人名识别研究   总被引:2,自引:0,他引:2  
采用统计与规则相结合的混合策略,提出一种中国人名的自动识别方法.该方法利用知识库中的统计信息,对中国人名作初步的提取,分析中国人名构成的内部特征和外部特征,提取出特征集,并总结出相应的识别规则,对候选人名进行识别,在此基础上构建了一个中国人名识别系统,并对系统进行了测试,实验表明了算法的可行性和有效性.  相似文献   

14.
彭勃  郭国弟 《科技信息》2010,(36):93-93
名词短语分析法是在项目需求规格说明书的基础上提取可以作为类的名词,对类进行分析,并完成初始类图的行之有效的方法。本论文以"处方跟踪系统"的分析为例,描述了用名词短语分析法进行分析,直至完成初始类图的过程,希望能成为对面向对象分析和设计方法感兴趣的读者们的参考。  相似文献   

15.
调制制式的自动识别是非合作通信系统接收机设计中的重要研究课题.着重讨论了利用特征参数对几种基本调制制式(DSB^*、FM、PM、2ASK、2FSK、2PSK)自动识别问题,对叠加了高斯白噪声的通信信号的自动识别进行了计算机仿真.实验结果表明,此种识别算法具有较为理想的识别效果.  相似文献   

16.
动宾短语和动补短语是语法研究的一个难点,对一些特定形式短语的归属问题,语法教学一直采取保守的态度。作试从语言发展角度对V P N形式(动 介 名词形式)、V Q形式(动 数 量形式)的动宾和动补定位进行综合分析与论述,以期做出合理的判定。  相似文献   

17.
通过探究英语学习者阅读速度慢、阅读理解正确率低的原因,寻求一种行之有效的阅读方法来帮助他们尽快达到英语阅读速度与阅读理解正确率高的要求,即短语快速识别法在英语阅读教学中的应用研究。实验结果表明,短语快速识别法可有效纠正阅读者逐字识别的不良阅读习惯,扩大视幅,从而帮助其提高阅读速度及阅读理解正确率。  相似文献   

18.
副词"也"在现代汉语中的使用频率很高,用法也较为复杂,其用法的自动识别对语义理解及句法分析有着重要意义.在已构建的副词"也"用法词典、规则和用法标注语料的基础上,分别采用了规则和统计的方法对副词"也"的用法进行了自动识别,实验结果显示微平均准确率分别为55.20%、62.48%;进而对规则识别结果和统计识别结果进行分析,采用多种方式,依据用法在语料中分布率、规则方法及统计方法识别的准确率以及分布率和准确率的综合等多种方式,将规则和统计结合起来进行用法自动识别,多种结合方式中最高微平均准确率达到了69.95%.  相似文献   

19.
本文依据语义关系,对聚合短语作了下位分类,划分出并列短语,承接短语,递进短语,选择短语,转折短语,起止短语六个次类,从语言事实出发,较尽地描写了这些短语的特点和一些语用问题,探讨了并列短语和选择短语中的模糊语言现象,特别是选择关系中既非相容,又非不相容,而是介乎二者之间的模糊态选择关系。本文还对“同位短语”、“连动式”的归属问题进行了研讨,认为同位短语不具有短语的资格,其后项应俄为注释性插入语处理,“连动式”则可化分为两类:一类归入组合短语里的偏正短,一类纳入聚合短语里的承接短语。  相似文献   

20.
为解决使用语音信号准确识别动物以保护和研究野生动物的问题,提出一种全连接算法与稀疏连接算法相结合的全卷积神经网络(FCNN: Fully Convolutional Neural Network),用于语音的自动识别.利用全连接算法提取更多的组合特征,稀疏连接算法筛选重要特征可加快收敛速度.同时给出了具体的模型结构及算法流程,并进行了动物语音识别实验.实验结果表明,该全卷积神经网络深度学习算法是一种语音自动识别的有效方法,解决了蛙声识别问题,为动物语音识别提供参考.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号