共查询到20条相似文献,搜索用时 31 毫秒
1.
汉语句型自动分析和分布统计算法与策略的研究 总被引:9,自引:1,他引:8
汉语句型的自动分析与分布统计是继我国汉字字频统计和词频统计之后的又一重要的基础性研究课题。本文就以结构特征为标准的句型系统,提出以谓语为中心的句型成分分析与句型匹配相结合的分析算法与策略,讨论了句型成分及其短语边界的识别与判定方法,给出了有关歧义结构的处理策略,以及实验模型的测试结果与分析。 相似文献
2.
该文提出面向文本聚类分析的实体—动作关联模型EARM,探讨汉语语义实体及其行为的描述方法。汉语属于非形态语言,语句没有时态及语态的变化,词类跟句法成分之间也不是简单的一一对应关系。该文提出一种句法成分识别机制,根据词汇类别特征及位置特征识别实体及动作。在句法成分识别的基础上展开句法分析,通过匹配句型特征建立实体—动作关联模型EARM,描述实体的行为及状态。对于嵌套句型等较为复杂的句型结构,需要在句法分析过程中实施动作层次分解,将复杂语句分解为简单的基本句型,以便于挖掘实体—动作关联。考虑到汉语语法比较灵活,语句成分缺省和倒装现象相对普遍,该文提出了倒装句的识别机制,通过匹配接近的句型进行实体移位,调整语序。论述了基于统计模型的EARM权重量化策略,借助语法树的最大公共子图量化文本的相似度并实施聚类,设计并开展了EARM实体—动作分析实验和EARM聚类实验。实验结果表明EARM的分析是准确有效的,聚类结果是合理的。 相似文献
3.
4.
中文文本自动校对中的语法错误检查 总被引:5,自引:1,他引:5
文章将中文文本的语法错误分为搭配错误和与句型成分相关的错误两大类。分别采用模式匹配的方法和基于句型成分分析的进行检查,这两种方法的结合,可以同时考虑局部和全局的语法限制信息,并且降低了语法检查的复杂度。通过对实验结果的分析和评测,证明文章所述的方法是可行的。 相似文献
5.
6.
在语义角色标注过程中,经常需要检索相似的已标注语料,以便进行参考和分析。现有方法未能充分利用动词及其支配的成分信息,无法满足语义角色标注的相似句检索需求。基于此,本文提出一种新的汉语句子相似度计算方法。该方法基于已标注好语义角色的语料资源,以动词为分析核心,通过语义角色分析、标注句型的相似匹配、标注句型间相似度计算等步骤来实现句子语义的相似度量。为达到更好的实验效果,论文还综合比较了基于知网、词向量等多种计算词语相似度的算法,通过分析与实验对比,将实验效果最好的算法应用到句子相似度计算的研究中。实验结果显示,基于语义角色标注的句子相似度计算方法相对传统方法获得了更好的测试结果。 相似文献
7.
用支持向量机方法分析280个解表类中药挥发性成分的GC-MS数据,探讨解表药挥发性成分与药性的相关性。以水蒸汽蒸馏法提取各药材的挥发性成分,利用GC-MS方法对其挥发性成分进行分析:对各药材不同类型化学成分的含量进行分类统计,并以不同类型化学成分的含量统计结果作为药性分类的特征指标;采用交叉验证法,利用支持向量机对不同药性解表药的数据进行交叉训练,建立解表药药性的预测模型;该模型对预测集中的辛温类药的正确识别率为95.0%,对辛寒类药的正确识别率为91.7%,总正确率为93.6%。实验结果表明解表类中药挥发性成分与其寒热药性具有较高的相关性,其中以解表类中药中的脂肪族及脂肪酸类成分、单萜氧化物成分对识别辛凉解表与辛温解表两种药性的贡献率最大。 相似文献
8.
文章首先介绍了句子句法、语义结构标注语料库的基本情况。在标注语料库的基础上,从句型的角度着眼定量统计,构建现代汉语单句的句型句模的对应体系,并进一步说明了句型句模对应关系研究的意义。 相似文献
9.
在“现代汉语句法语义信息语料库”的基础上,我们将相对独立的句型系统、句模系统和句干系统有机整合在一起,建立了一个有层级体系的句系系统。并将[P]、[SP]、[SPO]、[PO]定义为基础句型,利用解析法,考察了基础句型对应的高频句模在复杂句模生成机制中的主体作用,此外还考察了补语、状语同语义成分的对应情况。通过寻求简单句型和复杂句型、简单句模和复杂句模之间的组合映射规律,从而找到句型句模对应机制研究的一个新的突破点。 相似文献
10.
基于疑问句句型识别的问题理解研究 总被引:1,自引:0,他引:1
问题理解是问答系统中的一个关键步骤.问题理解的过程包括疑问词分类、问句分词及词性标注、疑问句句型识别、问题分类及问题中心的识别等.提出了对疑问句句型的识别方法,即通过对疑问句的短语句法树的分析,得到疑问句的句型结构,通过计算句型结构与句型模式之间的相似度来识别句子的句型.结合疑问句的语法分析,通过识别疑问句的句型实现了问题理解.实验结果表明,该方法提高了问题理解的准确度. 相似文献
11.
分布式视频点播网络成为当前的研究热点,文章从目前比较流行的CDN技术(内容分发网络)的缺点着手,提出以“鼎点天源”宽带平台为架构的分布式视频点播网络。在分析基于媒体服务器的统计策略和统计调度策略的的基础上,深入研究了视频服务器组间负载均衡策略,同一视频服务器组不同媒体服务器间的负载均衡策略。实际运营系统测试表明该调度策略有效地解决了分布式视频点播网络的负载均衡问题。 相似文献
12.
13.
传统多向核独立成分分析(MKICA)方法的实质是把基于独立成分分析(ICA)中的白化处理主元分析(PCA)替换为核主元分析(KPCA)后利用二阶统计量进行过程监控,并未利用过程数据的阶段特性和高阶累积量信息,为了解决此问题,提出高阶累积量分析(HCA)与多向核熵独立成份分析(MKECA)相结合的多向高阶累计量的核熵独立成分分析方法(HCA-MKEICA).首先,采用核熵独立成份分析(KECA)对原始数据进行数据转换,解决数据的非线性;然后,在高维核熵空间利用HCA技术构建新的统计量用于过程监控;最后,将该方法应用于青霉素仿真平台和实际的工业过程并与MKICA方法进行对比,以验证所提出方法的有效性. 相似文献
14.
15.
16.
差分进化算法参数控制与适应策略综述 总被引:4,自引:0,他引:4
差分进化算法逐渐成为进化计算领域最流行的随机搜索算法之一,已被成功用于求解各类应用问题.差分进化算法参数设置与其性能密切相关,因此算法参数控制与适应策略设计是目前该领域的研究热点之一,目前已涌现出大量参数控制方案,但尚缺乏系统性的综述与分析.首先简要介绍差分进化算法的基本原理与操作,然后将目前参数控制与适应策略分成基于经验的参数控制、参数随机化适应策略、基于统计学习的参数随机化适应策略和参数自适应策略4类进行系统性综述,重点介绍其中的参数适应与自适应策略.此外,为分析各种参数控制与适应策略的功效,以实值函数优化为问题背景设计了相关实验,进一步分析各种策略的效率与实用性,实验结果表明,参数自适应控制策略是目前该领域最有效的方法之一. 相似文献
17.
一个统计与科学数据库的数据模型 总被引:1,自引:0,他引:1
本文提出了一种新的语义数据模型——MICSUM.MICSUM由九种可嵌套引用的语义成分和两个语义成分上的代数操作构成,支持时间序列等复杂数据类型,以统计表和C-关系为数据操作的基本单位,提供了较强的模拟统计与科学数据的能力. 相似文献
18.
分析了各单一方法的分类性能,提出了神经网络与统计方法相集成的策略,由此提出MLFN-CCA-Fisher集成分类器。通过网络的自适应学习,将原样本模式经加权S型变换,映射到新的模式空间,能被线性分类,然后用相关成分分析方法提取特征,再建立Fisher判别模型。在性能测试与实际应用中,集成分类器均取得了良好的效果。 相似文献
19.
现实生活中双焦点问句是一种常用的句型,然而自动答疑系统中没有给出相对应的回答方式.针对这种状况,提出了基于双焦点问句的自动答疑系统构架.通过利用六大策略抽取双焦点问句的焦点字符串、采用不同句型产生主次焦点子问句,提高系统对双焦点问句的理解能力.实验结果表明,系统生成的主次焦点子问句的正确率分别为85.28%和87.50%,主焦点中心语的正确率为93.33%. 相似文献
20.
本文主要从计算语言学角度分析维吾尔语的句子结束形式,研究维吾尔语句子边界规则[1],简单句与复合句的划分规则,探讨划分思路,进行句型分类。以维吾尔语简单句中的陈述句为例,通过基于语料库的语义处理和语法处理,实现了现代维吾尔语简单句识别研究的算法与程序。 相似文献