首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
汉语句型自动分析和分布统计算法与策略的研究   总被引:8,自引:1,他引:8  
汉语句型的自动分析与分布统计是继我国汉字字频统计和词频统计之后的又一重要的基础性研究课题。本文就以结构特征为标准的句型系统,提出以谓语为中心的句型成分分析与句型匹配相结合的分析算法与策略,讨论了句型成分及其短语边界的识别与判定方法,给出了有关歧义结构的处理策略,以及实验模型的测试结果与分析。  相似文献   

2.
文章针对统计对象为动态统计算法的一类问题的系统特点,提出了面向数据对象的系统开发策略,并对其设计思想和主要技术问题作了讨论,给出应用实例。  相似文献   

3.
针对纳米图像微小、难以测量和统计等难题,提出机器视觉测量算法。根据目标形状特征,引入图案匹配,设计二者相融合的纳米图像特征自动测量与统计算法。根据纳米图像的形态和面积特征,实现基于机器视觉的目标分割;并嵌入图案匹配,分析目标形状,剔除杂质干扰,解决纳米图像难以自动测量和统计的问题。仿真实验表明,该算法在纳米图像特征自动测量与统计上可以达到较好的效果。  相似文献   

4.
5.
书面汉语自动分词的研究   总被引:2,自引:0,他引:2  
  相似文献   

6.
汉语自动分词词典机制的实验研究   总被引:66,自引:4,他引:66  
分词词典是汉语自动分词系统的一个基本组成部分。其查询速度直接影响到分词系统的处理速度。本文设计并通过实验考察了三种典型的分词词典机制:整词二分、TRIE索引树及逐字二分,着重比较了它们的时间、空间效率。实验显示:基于逐字二分的分词词典机制简洁、高效,较好地满足了实用型汉语自动分词系统的需要。  相似文献   

7.
机器翻译中汉语的形式和语义分析二题   总被引:3,自引:1,他引:2  
汉语分析是英汉和汉英机器翻译的难点。这篇文章提出了分析汉语的两个难题:一个是区分句法结构的歧义和多义,另一个是寻找句子成分之间的隐性语义关系和句式的意义。  相似文献   

8.
汉语智能接口的自动分词研究   总被引:2,自引:0,他引:2  
讨论了在旅游信息库汉语接口中的自动分词问题,基于系统的情况提出了模糊切分及形式分词与语法分析辅助分词相结合解决歧义切分、未登录词切分的方法,实验表明,该方法是可行的和令人满意的。  相似文献   

9.
汉语自动分词实用系统CASS的设计和实现   总被引:9,自引:1,他引:8  
近年来, 汉语自动分词成力中文信息处理的一大热门课题, 其研究进展令人关注。本文主旨, 是通过介绍CASS系统的设计和实现, 阐述汉语自动分词实用系统的一般性原理, 包括系统的总体结构、自动分词算法和分词词典的实现、各种多义切分字段的识别和处理, 等等。CASS系统由总控程序、自动分词程序、设施管理程序、分词词典和知识库等五大部分组成。自动分词算法程序选用正向增字最大匹配法ASM(+1,+1,+1)实现, 该算法的嵌套调用, 可以识别出各种多义切分字段, 包括任意多重的交集型多义字段。这个算法经过相应的运行控制, 可以实现其它各种分词方法。  相似文献   

10.
书面汉语自动分词技术与实现   总被引:1,自引:0,他引:1  
本文首先综述了书面汉语自动分词的若干方法及研究进展,并在此基础上,提出了一种基于知识的多遍扫描联想分词法,它提高了分词效率,比较成功的解决了汉语分词的歧义问题。该方法是一种实用的分词方法,是省长辅助DSS人机界面研究的子课题。该方法已在PC/XT机上用C语言实现。  相似文献   

11.
书面汉语自动分词专家系统的实现   总被引:8,自引:0,他引:8  
本文介绍了书面汉语自动分词专家系统的实现方法, 着重分析了该专家系统中知识库的组织与实现, 以及所用的推理机制与自动分词过程。最后给出了实验结果, 该结果表明自动分词专家系统的性能机为优异(其切分精度远远高于一般的自动分词系统)。  相似文献   

12.
语句核心动词的自动获取是以动词为中心的汉语语句分析中的重要组成部分。依据概念层次网络理论,在字词概念符号的基础上获取候选动词集合,根据动词的上下文语言环境对动词进行排除和分类处理,对可能作为语句核心动词的动词集合按照作语句核心结构的可能性大小排队,并验证其正确性。实验结果表明,在从真实语料切分得到的3121个语句中,经过排队处理后前三个动词作为语句核心动词的正确率达到了83%。错误分析表明进一步完善知识库及排除排队规则,还可以提高自动获取语句核心动词的正确率。  相似文献   

13.
基于统计方法的汉语自动文摘系统研究   总被引:11,自引:0,他引:11  
本文简要介绍了文本的向量空间模型表示,并提出了用该模型进行非受限真实文本的自动文摘方法。其基本思想是对输入文本进行项(本文为词和概念)的统计,根据不同项在文本中的分布评估其重要性,据此和其它信息形成句子的综合权重,生成摘要。文中较详细地介绍了系统的实现及实验结果,同时提出了对文摘系统的评价方法。  相似文献   

14.
提高汉语自动分词精度的多步处理策略   总被引:15,自引:6,他引:15  
汉语自动分词在面向大规模真实文本进行分词时仍然存在很多困难。其中两个关键问题是未登录词的识别和切分歧义的消除。本文描述了一种旨在降低分词难度和提高分词精度的多步处理策略,整个处理步骤包括7个部分,即消除伪歧义、句子的全切分、部分确定性切分、数词串处理、重叠词处理、基于统计的未登录词识别以及使用词性信息消除切分歧义的一体化处理。开放测试结果表明分词精确率可达98%以上。  相似文献   

15.
回顾了书面汉语自然分词的研究历史,提出了一种新的汉语分词设想——综合匹配法,并且给出了处理流程。  相似文献   

16.
基于规则的汉语自动分词系统   总被引:36,自引:3,他引:33  
本文通过对汉语自动分词难点的分析, 讨论了词频和词结合力的关系, 提出了一套机械切分与语义校正的汉语自动分词方法。系统包括建立绝对切分标志符表, 变长度最大匹配法、2一3一1优先规则集、固有歧义切分和组合歧义切分校正方法等。最后列举描述语义校正规则的实例。系统作为CETRAN.A的一部令, 在SUN8一280工作站上实现。  相似文献   

17.
汉语自动分词系统的评价   总被引:1,自引:0,他引:1  
汉语自动分词是中文信息处理中最基本的工作。近年来,已有多种自动分词软件问世,但尚无评价此类软件的标准、模型和方法。本文针对自动分词软件的特点,提出了自动分词软件的评价准则,并给出了定性和定量的度量方法。  相似文献   

18.
基于邻接知识的汉语自动分词系统   总被引:5,自引:0,他引:5  
  相似文献   

19.
汉语自动分词技术的现状及发展趋势   总被引:11,自引:0,他引:11  
尹锋  林亚平 《软件世界》1996,(12):80-84
一、汉语自动分词的提出与困难 汉语自动分词是80年代初期中文信息处理领域提出的重大课题,分为书面汉语分词和口词分词,前者指对键盘输入或以光电识别输入计算机的汉语进行处  相似文献   

20.
基于特征相关性的汉语文本自动分类模型的研究   总被引:17,自引:1,他引:17  
本文提出一种基于预定义类别与文本特征之间相关性的自动分类算法,并在文中详细阐述了汉语文本自动分类模型的设计与实现过程。为测试分类模型实现性能,建立具有12类别的分类体系,并构造包含近500篇汉语新闻语料的测试集。实验结果表明,评价自动分类算法的两个重要指标:查全率和查准率,都比较令人满意。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号