一种无需语句分割的中文文档自动分类方法研究及实现 |
| |
引用本文: | 何涛 黄国兴. 一种无需语句分割的中文文档自动分类方法研究及实现[J]. 计算机科学, 2004, 31(12): 137-138 |
| |
作者姓名: | 何涛 黄国兴 |
| |
作者单位: | 华东师范大学计算机科学与技术系,上海,200062;华东师范大学计算机科学与技术系,上海,200062 |
| |
摘 要: | 目前,对于外文文档的自动分类,已有许多有效的方法。但是,中文的特殊性使得这些方法对于中文文档不是很有效。本文提出了一种比较简单的中文文档的自动分类方法,即不用语句分割,只需要计算出文档中各个单字出现的频率,对照已经训练过的模版,就可以比较准确地对其分类。
|
关 键 词: | 中文文档分类 Apriori性质 语句分割 N-Gram 词素解析 |
An Approach for Chinese Document Classification with No Splitting |
| |
Abstract: | |
| |
Keywords: | |
本文献已被 维普 万方数据 等数据库收录! |
| 点击此处可从《计算机科学》浏览原始摘要信息 |
|
点击此处可从《计算机科学》下载全文 |
|