首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 171 毫秒
1.
利用错误驱动法、支持向量机法和隐马尔可模型3种方法对汉语文本进行名词短语识别,对实验进行比较分析,结果表明SVM与HMM的识别效果总体上要好于错误驱动法,HMM法在封闭测试中优势明显.研究表明错误驱动法适用于解决从语料库中学习转换规则的传统问题;SVM方法适用于解决两类别的分类问题;而HMM方法侧重应用在与线性序列相关的现象上.  相似文献   

2.
为了进一步提高基本名词短语(BaseNPs)的识别精度,针对最大熵方法和Brill方法各自的特点,提出基于两者相结合的英语基本名词短语识别算法.该算法是在高准确率词性标注的基础上实现的.在训练和测试两个阶段中,均先采用最大熵方法识别基本名词短语,然后将已具有很高精度的识别结果作为初始标注结果运用于Brill方法中.实验结果表明,此联合算法达到了94%的准确率和召回率,充分融合了最大熵方法和Brill方法的优点,可与基于相同训练和测试语料的目前最理想的英语基本名词短语识别结果相比.  相似文献   

3.
最大熵和Brill方法结合识别英语BaseNPs   总被引:1,自引:0,他引:1  
为了进一步提高基本名词短语(BaseNPs)的识别精度,针对最大熵方法和Brill方法各自的特点,提出基于两者相结合的英语基本名词短语识别算法.该算法是在高准确率词性标注的基础上实现的.在训练和测试两个阶段中,均先采用最大熵方法识别基本名词短语,然后将已具有很高精度的识别结果作为初始标注结果运用于Brill方法中.实验结果表明,此联合算法达到了94%的准确率和召回率,充分融合了最大熵方法和Brill方法的优点,可与基于相同训练和测试语料的目前最理想的英语基本名词短语识别结果相比.  相似文献   

4.
用于音乐和语音的识别方法不适用于非结构化环境声音事件的识别。提出一种基于隐马尔可夫模型(HMM)和支持向量机(SVM)的二层分类策略,对家庭保健监测系统中的语音、警报声、电话铃声、笑声、尖叫声和咳嗽声等6种声音事件进行识别。首先,提取Mel频率倒谱系数(MFCCs)来分析环境声音信号。其次,以提取的MFCC特征为输入,依次采用HMM和SVM构造二级分类模型,通过识别和确认两个过程来对家庭保健监测系统中的环境声音事件进行识别。实验证明,该技术能提高家庭保健监测系统中易混淆环境声音的识别率。
  相似文献   

5.
针对中文人称名词短语单复数属性信息不明确,对消解贡献低的问题,利用改进的最大熵模型提出了人称代词消解新的模型.该模型在原有特征的基础上增加了人称名词短语单复数识别的Head特征、Qun特征和Len特征.在真实文本环境下与不使用单复数属性信息方法进行了对比实验,结果表明该方法的F值与不使用单复数属性信息方法的F相比有一定的提高.  相似文献   

6.
刘潇  和应民  陈力伟 《应用科技》2006,33(6):18-20,23
介绍一种适用于实时语音识别环境下的神经网络模型——动态识别神经网络(dynamic recognition neural network,DRNN).DRNN聚类学习的性能使得它非常适用于与在线学习方式相结合的实时语音识别系统.通过比较DRNN和隐含马尔科夫模型(hidden Markov model,HMM),可以看到不论是在训练方面还是在识别方面,DRNN算法的计算复杂程度都要低于HMM算法.  相似文献   

7.
阐述了基于统计的SVM(支持向量机)模型的汉语句子组块识别. SVM模型使用已进行组块标注的语料,通过多种特征参数选择和多分类划分,对数据进行统计学习得到训练模型后实现. 给出模型的算法和识别结果,分析了统计模型的特点.  相似文献   

8.
随着计算机技术的迅猛发展,知识变成人工智能领域中的一个重要资源。在面向自由文本的自动知识抽取中,名词短语识别是基础的任务之一,尤其是含动词的名词短语。已有的名词短语识别研究更多地着眼于命名实体的识别,范围较窄且不能解决其他含动词的名词短语,加之含动词名词短语识别存在分词错误、边界确定、特殊结构、标记数据少等难点,含动词名词短语识别目前仍然是一个巨大的挑战。基于此,文章提出了一种神经网络与规则、统计相结合的方法。首先对语句进行预处理,其中包含包括词性、助词、时间、数量词等内容的修正和合并;然后,使用双向LSTM与条件随机场融合的方法对含动词命名实体进行识别;接着使用百度词条、固定搭配、语义分类和描述框架文法的方式对含动词名词短语识别;最后使用随机抽取的多动词文本进行实验和分析,实验结果表明,本文方法达到89%的准确率。  相似文献   

9.
基于演化超网络的中文文本分类方法   总被引:2,自引:0,他引:2  
为了提高中文文本的分类效果,提出了一种基于演化超网络的中文文本分类方法.采用中国科学院计算技术研究所的汉语词法分析系统对中文文本进行分词,保留文本中的名词、动词和形容词作为特征;以X2统计方法进行特征选择;利用布尔权重计算特征权值.经处理后的特征向量作为系统的训练集和测试集数据.运用超边替代策略训练超网络分类模型,并实现对测试集特征向量的分类.对不同阶数设定下的演化超网络模型进行了性能分析,并将其与传统的KNN和SVM算法进行了比较.结果表明,本方法对复旦大学语料和搜狐语料可获得87.2%和72.5%的宏识别率、86.9%和70.5%的宏召回率、87.0%和71.5%的宏F1,接近或优于KNN和SVM分类方法.所提出的方法是一种有效的中文文本分类手段.  相似文献   

10.
数量名短语的识别是识别由数量短语修饰的名词短语左右边界的研究.以往研究中,基于统计学习模型的数量短语识别方法依赖人工特征,需要通过专家知识构建知识库来实现对"数词+量词"短语的识别.本文在以往研究基础上纳入"名词"形成"数词+量词+名词"等八类数量名短语,并采用深度学习方法解决这一边界识别任务.通过BERT模型对原始文...  相似文献   

11.
用光杆短语结构理论分析英语和汉语中的生成性名词短语,认为汉语中的一部分"的"字结构、"者"字结构和英语中的"the+形容词"、"the+分词"以及"通过词缀名词化的短语"都是生成性的名词短语,它们都可以被描述为限定词短语,限定词短语具有名词性。在这项研究中英语与汉语呈现共性,名词短语与句子也呈现共性。  相似文献   

12.
以已经分词并进行了词性标注和介词短语标注的《人民日报》为实验语料,选取其中出现频次高于20次的61个介词为实验对象,采用支持向量机、最大熵和条件随机场这3种统计模型,对介词短语边界识别进行了研究.实验结果表明在3种模型中,采用条件随机场模型效果最好,微平均准确率达到了95.68%.  相似文献   

13.
一种基于SVM和规则消除组合型歧义的算法   总被引:2,自引:0,他引:2  
歧义的处理是影响分词系统切分精度的重要因素,也是中文自动分词系统中较为困难的问题.提出一种基于支持向量机(SVM)和规则(Rules)相结合的算法(SR算法),对中文分词过程中的组合型歧义字段进行排歧.SR算法主要思想是利用支持向量机分类的原理,结合词性搭配的一些规则排除组合型歧义.实验表明,用此算法对几种不同的语料进行排歧测试,排除组合型歧义字段的切分正确率可达83%左右,为解决中文自动分词难题提供了一条新路径.  相似文献   

14.
根据英语名词短语的句法功能,提出了一种新的英语名词短语——功能名词短语,同时与基本名词短语和最长名词短语相比较.利用Google在线翻译系统,对存在结构歧义的句子进行了翻译,发现英汉机器翻译的错误主要是由结构歧义引起的,并应用功能名词短语的定义对结构歧义问题予以解决.实验结果表明,功能名词短语的识别能够有效消解两种结构歧义:一是与动词构成固定搭配的名词引起的歧义;二是"介词+名词"结构是作状语还是作后置定语的歧义.功能名词短语的研究对消除句法结构歧义、提高英汉机器翻译译文质量具有重要意义.  相似文献   

15.
本文不停留于分析名词谓语结构的语义或句法特点,而是立足于汉语的事实.以"元"为基础,从发生学机制上提出了"维度观"的"重新分析"论点,旨在挖掘汉语背后的"殊相",为人文科学的多样性和多元化献上绵薄之力.同时也论述了汉语名词性词语的"述谓性"及层次性.对汉语教学与表达、汉语句法、句式及语义分析以及信忠工程等,有一些思考和启发.  相似文献   

16.
本文不停留于分析名词谓语结构的语义或句法特点,而是立足于汉语的事实,以“元”为基础,从发生学机制上提出了“维度观”的“重新分析”论点,旨在挖掘汉语背后的“殊相”,为人文科学的多样性和多元化献上绵薄之力。同时也论述了汉语名词性词语的“述谓性”及层次性。对汉语教学与表达、汉语句法、句武及语义分析以及信息工程等,有一些思考和启发。  相似文献   

17.
体词性谓语现象是一种语言现象.句子结构内不存在形态上的主谓一致关系制约是汉语存在体词性谓语句的外在条件,是否具有潜在的谓词性特征则是体词性词语直接充任谓语的内在动因;此外,语用因素的作用也可能导致部分体词性谓语句的出现."名词动用"现象中被临时用作"动词"的名词本身并不内含谓词性特征,因此该现象的出现是词语在话语或篇章层面上形成的一种临时的功能变异,是语境因素、特殊的交际需要以及特殊句法手段的运用等多方面因素综合作用的结果,属于一种言语活动现象.  相似文献   

18.
A face recognition system based on Support Vector Machine(SVM) and Hidden Markov Model (HMM) has been proposed. The powerful discriminative ability of SVM is combined with the temporal modeling ability of HMM. The output of SVM is moderated to be probability output, which replaces the Mixture of Gauss (MOG) in HMM. Wavelet transformation is used to extract observation vector, which reduces the data dimension and improves the robustness.The hybrid system is compared with pure HMM face recognition method based on ORL face database and Yale face database. Experiments results show that the hybrid method has better performance.  相似文献   

19.
汉语中的动词没有词形变化,动词可直接充当主语、谓语、宾语、定语、状语、补语等成分,致使汉语呈动态特征。英语在正式文体中习惯于用名词或名词性短语来表动作,而且谓语常用弱化或虚化动词,致使英语呈静态特征。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号