排序方式: 共有33条查询结果,搜索用时 15 毫秒
1.
2.
该文利用DF与CHI统计量相结合的特征选取方法,针对互联网上对外汉语相关领域的网页进行特征提取,并在此基础上,构建了基于标题与正文相结合的两步式主题相关度判定分类器。基于该分类器做对外汉语相关主题的网页爬取工作,实验表明,效率和召回率比传统分类器都有较大程度的提高,目前该分类器已经用于为大型对外汉语语料库构建提供数据源。 相似文献
3.
基于自动句对齐的相似古文句子检索 总被引:3,自引:0,他引:3
随着语料库语言学的兴起,基于实例的机器翻译(EBMT)得到越来越多的研究。如何快速准确地构建大规模古今汉语平行语料库,以及从大量的对齐实例(句子级)中检索和输入句子最相似的源句子是基于实例的古今汉语机器翻译必须解决的问题。本文综合考虑句子长度、汉字字形、标点符号三个因素提出了古今汉语句子互译模型,基于遗传算法、动态规划算法实现了古今汉语的自动句对齐。接着为古文句子建立全文索引,基于汉字的信息熵,本文设计与实现一种高效的最相似古文句子检索算法。最后给出了自动句对齐和最相似古文句子检索的实验结果。 相似文献
4.
5.
6.
文章主要介绍信息化技术在数据管理、计量管理方面的应用。大宗物料系统取代了过去的人工传递数据的方式。该系统由发焦数据系统和 HTK-196型铁路车号自动识别系统等组成。设置数据处理中心服务器一台,用以接收轨道衡车号系统传送的数据信息,对数据进行统一管理,并实现存储、显示、查询、打印等功能。另外设置终端分别设于运输、筛焦等单位,用以从中心服务器提取所需要的数据,建立报表输出。该系统对焦化厂以前物流体系进行了重大改进,提高了焦化厂整体管理水平,并挖掘出了重大经济效益。 相似文献
7.
8.
9.
10.
国际汉语教学领域中存在大量的动态词。深入细致地研究分析国际汉语教材语料中真实出现的动态词,一方面有助于国际汉语教学的词汇研究与词汇教学;另一方面,对面向国际汉语教学的信息处理工作具有重要的促进作用。三音节名词是国际汉语教学中一种常见的词汇类型,在词汇教学中占有重要的位置,而其中三音节名词型动态词又占有较高的比重。该文首先介绍三音节名词型动态词结构模式的一种知识表示方法;然后通过标注一定规模的国际汉语教材语料,获取三音节名词型动态词的所有结构模式类型以及对应的动态词及词频信息,构建基于国际汉语教学的三音节名词型动态词结构模式知识库;最后在结构模式知识库的基础上对三音节名词型动态词进行分析。 相似文献