首页 | 官方网站   微博 | 高级检索  
     

CFV-NB:基于概念特征向量的NB文档分类模型 
引用本文:何丽,刘军.CFV-NB:基于概念特征向量的NB文档分类模型 [J].计算机工程,2006,32(20):4-6.
作者姓名:何丽  刘军
作者单位:1. 天津大学管理学院,天津,300072;天津财经大学理工学院,天津,300222
2. 天津财经大学理工学院,天津,300222
基金项目:天津自然科学基金资助项目(033611011);天津市高等学校科技发展基金资助项目(20041603)
摘    要:提出了一种基于概念特征向量的NB文档分类方法。该方法在未标注文档集上通过SOM(Self-Organizing Maps)聚类产生若干初始文档类,并为每个文档类分配一个类标签,使用最大信息熵的方法建立每个文档类的概念特征向量。在概念特征向量空间上建立最终的文档分类器:CFB-NB。

关 键 词:文档分类  概念特征向量  NB分类器
文章编号:1000-3428(2006)20-0004-03
收稿时间:01 25 2006 12:00AM
修稿时间:2006年1月25日

CFV-NB: Naïve-Bayes Documents Classification Model Based on Concept Feature Vectors
HE Li,LIU Jun.CFV-NB: Naïve-Bayes Documents Classification Model Based on Concept Feature Vectors[J].Computer Engineering,2006,32(20):4-6.
Authors:HE Li  LIU Jun
Affiliation:1. College of Management, Tianjin University, Tianjin 300072; 2. College of Technology, Tianjin University of Finance and Economics, Tianjin 300222
Abstract:This paper proposes a novel Nave-Bayes document classification method based on the set of concept feature vectors. It produces someinitial classes from the set of unlabeled Web documents by SOM clustering and distributes a label for each, and builds the corresponding conceptfeature vector for each initial class using the maximum entropy method. It builds the last CFV-NB document classifier based on the space of conceptfeature vectors.
Keywords:Document classification  Concept feature vectors  NB classifier
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程》浏览原始摘要信息
点击此处可从《计算机工程》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号