首页 | 官方网站   微博 | 高级检索  
     

一个对不带类别标记文本进行分类的方法
引用本文:蒋志方,祝翠玲,吴 强.一个对不带类别标记文本进行分类的方法[J].计算机工程,2007,33(12):96-98.
作者姓名:蒋志方  祝翠玲  吴 强
作者单位:[1]山东大学计算机科学与技术学院,济南250061 [2]山东经济学院信息管理学院,济南250014
摘    要:利用无监督聚类方法和朴素贝叶斯分类的特点,把UC获得的预分类结果作为朴素贝叶斯分类器的训练样本,将处在聚类结果中类属模糊区域的文本交给训练好的朴素贝叶斯分类器再进行分类,实现了对不带任何类别标记文本的准确分类,可得到较准确的分类结果。

关 键 词:文本分类  无监督文本聚类  朴素贝叶斯分类  欧氏距离
文章编号:1000-3428(2007)12-0096-03
修稿时间:2006-08-24

Method of Unlabeled Texts Classification
JIANG Zhifang,ZHU Cuiling,WU Qiang.Method of Unlabeled Texts Classification[J].Computer Engineering,2007,33(12):96-98.
Authors:JIANG Zhifang  ZHU Cuiling  WU Qiang
Affiliation:1. School of Computer Science and Technology, Shandong University, Jinan 250061; 2. College of Information Management, Shandong Economic University, Jinan 250014
Abstract:Using the specialty of the unsupervised clustering and the naïve Bayes classification, the paper gives a method that gains results of the text clusters and takes some of results as the training samples of the naïve Bayes classifier and let the trained naïve Bayes classifier reclassify those texts in illegible area of the clustering results. Consequently the method can classify the unlabeled text accurately and also can gain a better result of classification.
Keywords:Text classification  Unsupervised text clustering  Naïve Bayes classification  Euclid distance
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程》浏览原始摘要信息
点击此处可从《计算机工程》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号