首页 | 官方网站   微博 | 高级检索  
     

基于相对贡献率的特征选择方法
引用本文:杨杰明,王静,曲朝阳.基于相对贡献率的特征选择方法[J].东北电力学院学报,2014(4).
作者姓名:杨杰明  王静  曲朝阳
作者单位:东北电力大学 信息工程学院,吉林 吉林,132012
摘    要:特征选择是文本分类过程中极其重要的一个环节。本文提出了一种新的特征选择算法,该算法基于一个特征频度相对于其它特征频度的差值的总和衡量其相对贡献率的大小,从而进行特征选择。本文使用了基准数据集20-Newgroups,在朴素贝叶斯和支持向量机两个分类器上对该方法进行了验证。实验结果表明,与信息增益、互信息,几率比和DIA相关因子等四种流行的特征选择算法相比,该算法有效降低了文本的特征维数,提高了分类精度。

关 键 词:特征选择  文本分类  相对贡献率  特征频度

Feature Selection Method Based on the Relative Contribution
YANG Jie-ming,WANG Jing,QU Zhao-yang.Feature Selection Method Based on the Relative Contribution[J].Journal of Northeast China Institute of Electric Power Engineering,2014(4).
Authors:YANG Jie-ming  WANG Jing  QU Zhao-yang
Abstract:
Keywords:Feature selection  Text categorization  Relative contribution  Characteristic frequency
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号