首页 | 官方网站   微博 | 高级检索  
     

基于类别分布特征的快速文本分类方法
引用本文:杨林波,王士同. 基于类别分布特征的快速文本分类方法[J]. 计算机工程与设计, 2009, 30(5)
作者姓名:杨林波  王士同
作者单位:江南大学信息工程学院,江苏,无锡,214122;江南大学信息工程学院,江苏,无锡,214122;江南大学创新多媒体中心,江苏,无锡,214122
基金项目:教育部科学技术研究重点项目 
摘    要:中心和边界是类别分布的重要特征.利用训练样本类别分布特征,提出了一种基于类别分布特征的快速文本分类算法.依据类别分布特征调整文本与类别的相似度,克服了数据集类别间样本分布不均衡和类别中样本密度不均的缺点,提高分类的性能.实验结果表明,该算法提高了文本分类的效果,显示出了较好的鲁棒性,并显著提高了文本分类效率.

关 键 词:文本挖掘  文本分类  分布特征  快速分类  信息检索

Fast text categorization approach based on distribution character of class (DCC)
YANG Lin-bo,WANG Shi-tong. Fast text categorization approach based on distribution character of class (DCC)[J]. Computer Engineering and Design, 2009, 30(5)
Authors:YANG Lin-bo  WANG Shi-tong
Abstract:
Keywords:
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号