共查询到20条相似文献,搜索用时 0 毫秒
1.
汉语句型自动分析和分布统计算法与策略的研究 总被引:8,自引:1,他引:8
汉语句型的自动分析与分布统计是继我国汉字字频统计和词频统计之后的又一重要的基础性研究课题。本文就以结构特征为标准的句型系统,提出以谓语为中心的句型成分分析与句型匹配相结合的分析算法与策略,讨论了句型成分及其短语边界的识别与判定方法,给出了有关歧义结构的处理策略,以及实验模型的测试结果与分析。 相似文献
2.
文章针对统计对象为动态统计算法的一类问题的系统特点,提出了面向数据对象的系统开发策略,并对其设计思想和主要技术问题作了讨论,给出应用实例。 相似文献
3.
唐彩红 《计算机应用与软件》2014,(9)
针对纳米图像微小、难以测量和统计等难题,提出机器视觉测量算法。根据目标形状特征,引入图案匹配,设计二者相融合的纳米图像特征自动测量与统计算法。根据纳米图像的形态和面积特征,实现基于机器视觉的目标分割;并嵌入图案匹配,分析目标形状,剔除杂质干扰,解决纳米图像难以自动测量和统计的问题。仿真实验表明,该算法在纳米图像特征自动测量与统计上可以达到较好的效果。 相似文献
4.
5.
6.
7.
机器翻译中汉语的形式和语义分析二题 总被引:3,自引:1,他引:2
汉语分析是英汉和汉英机器翻译的难点。这篇文章提出了分析汉语的两个难题:一个是区分句法结构的歧义和多义,另一个是寻找句子成分之间的隐性语义关系和句式的意义。 相似文献
8.
9.
汉语自动分词实用系统CASS的设计和实现 总被引:9,自引:1,他引:8
近年来, 汉语自动分词成力中文信息处理的一大热门课题, 其研究进展令人关注。本文主旨, 是通过介绍CASS系统的设计和实现, 阐述汉语自动分词实用系统的一般性原理, 包括系统的总体结构、自动分词算法和分词词典的实现、各种多义切分字段的识别和处理, 等等。CASS系统由总控程序、自动分词程序、设施管理程序、分词词典和知识库等五大部分组成。自动分词算法程序选用正向增字最大匹配法ASM(+1,+1,+1)实现, 该算法的嵌套调用, 可以识别出各种多义切分字段, 包括任意多重的交集型多义字段。这个算法经过相应的运行控制, 可以实现其它各种分词方法。 相似文献
10.
书面汉语自动分词技术与实现 总被引:1,自引:0,他引:1
本文首先综述了书面汉语自动分词的若干方法及研究进展,并在此基础上,提出了一种基于知识的多遍扫描联想分词法,它提高了分词效率,比较成功的解决了汉语分词的歧义问题。该方法是一种实用的分词方法,是省长辅助DSS人机界面研究的子课题。该方法已在PC/XT机上用C语言实现。 相似文献
11.
书面汉语自动分词专家系统的实现 总被引:8,自引:0,他引:8
本文介绍了书面汉语自动分词专家系统的实现方法, 着重分析了该专家系统中知识库的组织与实现, 以及所用的推理机制与自动分词过程。最后给出了实验结果, 该结果表明自动分词专家系统的性能机为优异(其切分精度远远高于一般的自动分词系统)。 相似文献
12.
语句核心动词的自动获取是以动词为中心的汉语语句分析中的重要组成部分。依据概念层次网络理论,在字词概念符号的基础上获取候选动词集合,根据动词的上下文语言环境对动词进行排除和分类处理,对可能作为语句核心动词的动词集合按照作语句核心结构的可能性大小排队,并验证其正确性。实验结果表明,在从真实语料切分得到的3121个语句中,经过排队处理后前三个动词作为语句核心动词的正确率达到了83%。错误分析表明进一步完善知识库及排除排队规则,还可以提高自动获取语句核心动词的正确率。 相似文献
13.
基于统计方法的汉语自动文摘系统研究 总被引:11,自引:0,他引:11
本文简要介绍了文本的向量空间模型表示,并提出了用该模型进行非受限真实文本的自动文摘方法。其基本思想是对输入文本进行项(本文为词和概念)的统计,根据不同项在文本中的分布评估其重要性,据此和其它信息形成句子的综合权重,生成摘要。文中较详细地介绍了系统的实现及实验结果,同时提出了对文摘系统的评价方法。 相似文献
14.
15.
16.
基于规则的汉语自动分词系统 总被引:36,自引:3,他引:33
本文通过对汉语自动分词难点的分析, 讨论了词频和词结合力的关系, 提出了一套机械切分与语义校正的汉语自动分词方法。系统包括建立绝对切分标志符表, 变长度最大匹配法、2一3一1优先规则集、固有歧义切分和组合歧义切分校正方法等。最后列举描述语义校正规则的实例。系统作为CETRAN.A的一部令, 在SUN8一280工作站上实现。 相似文献
17.
18.
19.
汉语自动分词技术的现状及发展趋势 总被引:11,自引:0,他引:11
一、汉语自动分词的提出与困难 汉语自动分词是80年代初期中文信息处理领域提出的重大课题,分为书面汉语分词和口词分词,前者指对键盘输入或以光电识别输入计算机的汉语进行处 相似文献
20.
基于特征相关性的汉语文本自动分类模型的研究 总被引:17,自引:1,他引:17
本文提出一种基于预定义类别与文本特征之间相关性的自动分类算法,并在文中详细阐述了汉语文本自动分类模型的设计与实现过程。为测试分类模型实现性能,建立具有12类别的分类体系,并构造包含近500篇汉语新闻语料的测试集。实验结果表明,评价自动分类算法的两个重要指标:查全率和查准率,都比较令人满意。 相似文献