首页 | 官方网站   微博 | 高级检索  
     

一种无需语句分割的中文文档自动分类方法研究及实现
引用本文:何涛 黄国兴. 一种无需语句分割的中文文档自动分类方法研究及实现[J]. 计算机科学, 2004, 31(12): 137-138
作者姓名:何涛 黄国兴
作者单位:华东师范大学计算机科学与技术系,上海,200062;华东师范大学计算机科学与技术系,上海,200062
摘    要:目前,对于外文文档的自动分类,已有许多有效的方法。但是,中文的特殊性使得这些方法对于中文文档不是很有效。本文提出了一种比较简单的中文文档的自动分类方法,即不用语句分割,只需要计算出文档中各个单字出现的频率,对照已经训练过的模版,就可以比较准确地对其分类。

关 键 词:中文文档分类  Apriori性质  语句分割  N-Gram  词素解析

An Approach for Chinese Document Classification with No Splitting
Abstract:
Keywords:
本文献已被 维普 万方数据 等数据库收录!
点击此处可从《计算机科学》浏览原始摘要信息
点击此处可从《计算机科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号