首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 125 毫秒
1.
提出了一种统计与规则相结合的算法,即优先合并算法,通过计算词语相关度来合并短语,并在句法和语义上利用短语规则和语义词典进行校验,按照层次分析的方式实现了对汉语短语的机器识别.  相似文献   

2.
用基于Abney的方法来识别汉语的基本名词短语,定义了一套比较适合计算机处理的汉语组块体系,设计实现了一种基于规则、能够分析有限层次的组块自动识别算法.  相似文献   

3.
提出了一种基于MapReduce模型,利用向量矩阵和Apriori算法实现关联规则数据挖掘的新算法.算法利用MapReduce模型处理向量矩阵,结合Apriori算法思想,产生局部频繁项集,通过合并处理得到全局频繁项集.实验证明算法能提高关联规则挖掘的效率.  相似文献   

4.
算符优先分析法是分析算术表达式的有力工具,这种分析方法主要是寻找句型的最左素短语,本文给出算符优先文法最左素短语的一种判断算法。  相似文献   

5.
作为当前形式概念分析领域的研究热点,利用三支概念格可以实现更为有效的决策分析。该文在现有基于属性导出三支概念格的规则提取基础上,研究了基于对象导出三支概念格的规则提取,并与经典概念格及属性导出三支概念格下的规则提取进行了比较。然后通过对象导出三支概念格和属性导出三支概念格的合并,定义了对象/属性导出合并三支概念格,并提出了相应的规则提取算法。理论分析和实例结果表明,对象导出三支概念格和属性导出三支概念格的合并进一步改善了生成规则的质量。  相似文献   

6.
为了提高实时嵌入式多媒体系统动态内存分配的效率,提出一种基于两级离散列表(Two-Level Segregate Fit,TLSF)的模糊阈值合并算法.根据内存区间的使用概率和空闲块数统计,运用模糊规则计算合并系数,并与由碎片率决定的动态阈值相比较,决定是否推迟合并.实验结果表明,该算法在内存大小随机分配时与TLSF算法的性能相当;在实际的视频点播系统应用中,分配和释放效率分别提高了12.6%和9.5%.  相似文献   

7.
关联规则是数据挖掘的重要研究内容之一,而传统算法生成的关联规则之间存在着大量的冗余规则,这使得用户分析和利用这些规则变得十分困难。为了帮助用户分析,可以采用各种技术来有效地减少大量冗余的规则。本文介绍了冗余关联规则的概念,冗余关联规则删减的算法,结合当前的研究成果分析冗余关联规则的发展趋势。  相似文献   

8.
提高频繁项集挖掘算法的效率一直是数据挖掘领域中关联规则挖掘研究的一个重点。针对数据挖掘的现状及关联规则算法的瓶颈问题,提出一种基于串与运算的关联规则挖掘算法,对该算法进行了阐述。最后对该算法的特点进行了总结并对关联规则挖掘的未来研究方向进行了展望。  相似文献   

9.
近年来,中文产品评论的特征情感分类是Web数据挖掘的重要研究内容之一.提出了一套完整的产品命名实体、特征词、情感词以及边界的标注规则,设计了多层次的混合标签模式;提出了双层HHMM(层级隐马尔科夫模型)结构,将词形标注和词性标注的特点进行融合;提出了基于词形标注的HHMM-1算法和基于词性标注的HHMM-2算法,实现复杂短语的自动标注.实验证明,双层HHMM模型起到了互补的作用,模型的查全率和F-score值均有较大提高.  相似文献   

10.
对关联规则的Apriori算法的思想和性能进行了分析,提出了一种基于超级哈希树的关联规则挖掘算法,该算法只需扫描三次数据库,即可找出所有的频繁项目集,在每项事务的项目数不是太多的情况下,算法效率较Apriori有较大的改进。  相似文献   

11.
英汉两种语言都利用数量短语这种形式表达数量概念。本文对两种语言中数量短语的构成、句法分布以及造成分布差异的原因进行了分析与探讨,并提出造成这种差异的根本原因在于英汉信息安排遵循不同的准则。  相似文献   

12.
自建信息英语语料库,统计各类焦点提示词语及句型出现的频次,研究信息英语的信息焦点,尤其是信息英语语篇的词汇聚焦和句型聚焦手段。研究发现,信息英语语篇中的添加性焦点提示词语出现频次最高,而表示静态性的"有"字句句型聚焦出现频次也很高,这对把握信息英语语篇的规律和促进信息科技的传播将起到积极的作用。  相似文献   

13.
首字母联想记忆是一种十分有效的记忆方法,叙述了怎样将此方法用于记忆英语中的五条语法规则,即后接动名词的动词和动词短语、后接动词不定式的动词、两类虚拟语气、形容词在名词前的排列顺序.  相似文献   

14.
现在网络上一些四字语很流行。本文试图探讨它们的语法结构是否符合汉语的习惯,语义表达是否清晰,以及它们的前途。本文认为,网络四字语来源多样,表义的清晰度也不同。文章着重分析了简缩四字语的语音、语义、词法方面的特点,认为大部分简缩四字语并不是语词,不符合汉语的构词法,表义不清晰。  相似文献   

15.
词汇法--认识语言习得本质的新视角   总被引:5,自引:0,他引:5  
近年来,虽然我国对大学英语教学提出改革, 但由于长期受结构主义影响,外语学习过分强调语言结构和语言形式的掌握,对此词汇学派提出了一种新的语言习得理念,对词汇进行新的界定.通过对比这两种观点,引入对语言本质的深入思考,得出词汇短语,而非生成学派所提出的句法,才是语言使用者内化知识的基础,并可以大大增强语言的产出能力,还进一步提出了词汇短语理论对我国英语教学的启示.  相似文献   

16.
基于Apriori数据挖掘算法研究   总被引:3,自引:0,他引:3  
关联规则是从数据集中识别出频繁出现的属性值集,然后利用这些频繁集创建描述关联关系的规则过程.在分析经典关联规则挖掘算法的基础上,讨论了经典的Apriori算法,并提出改进的Apriori关联规则算法,对算法进行了实验数据的算法性能分析及运行时间对比.结果表明,改进的算法在运行速度和挖掘性能上都较经典的Apriori算法都有显著提高.  相似文献   

17.
利用广义相关系数改进的关联规划生成算法   总被引:3,自引:0,他引:3  
提出了一种改进的关联规则生成算法,其目的是在大型数据库中能够高效的发现关联知识。为了达到这个目标,将泛逻辑中的广义相关系数与Apriori算法相结合。Apriori算法本身对于大型数据库来说是高效的,但通常会产生出太多的关联规则,而广义相关系数是一个新的能够度量相关性的参数,因此对它进行了详细分析,并与原算法所使用的条件概率方法进行了比较,该算法有效地改进了由Agrawal提出的关联规则生成算法。  相似文献   

18.
针对现有搜索引擎的搜索结果数目庞大要从中找到有用信息十分困难的问题,基于将Web搜索结果进行聚类可以方便用户快速浏览搜索结果的思想,提出了一种基于形式概念分析的Web搜索结果聚类方法。首先从搜索结果中集中提取关键短语和非关键短语,然后从搜索结果集到关键短语和非关键短语集上建立形式背景,采用一种较快概念格生成算法在该形式背景上生成概念格,概念格上的一个概念表达了具有确定意义的主题,即得到Web搜索结果的一个类:每个概念内涵具有的关键短语或非关键短语作为类标记;概念的外延所包含的搜索结果文档作为该类的内容;搜索结果各个类之间的层次关系通过概念格上的层次关系得以体现。  相似文献   

19.
结构消歧是句法分析的一项重要任务.研究表明,增加复杂特征有利于提高句法分析系统的消歧能力.但相对于不包含复杂特征的句法分析系统,包含复杂特征规则的系统,通常规则数量较大,规则的匹配和存贮成为句法分析算法面临的一个问题.提出一种基于RETE网的高效可并行的句法分析算法.该算法将复杂特征规则转换为RETE匹配网,从而实现规则的高效存贮和快速匹配.实验表明,该算法可以有效组织大量多特征规则,并进行高速句法分析.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号