首页 | 官方网站   微博 | 高级检索  
     

集合CHI与IG的特征选择方法
引用本文:王 光,邱云飞,史庆伟.集合CHI与IG的特征选择方法[J].计算机应用研究,2012,29(7):2454-2456.
作者姓名:王 光  邱云飞  史庆伟
作者单位:辽宁工程技术大学软件学院,辽宁葫芦岛,125105
基金项目:国家自然科学基金资助项目(70971059)、辽宁省教育厅基金资助项目(L2010168)
摘    要:通过分析特征词与类别间的相关性,在原有卡方特征选择和信息增益特征选择的基础上提出了两个参数,使得选出的特征词集中分布在某一特定类,并且使特征词在这一类中出现的次数尽可能地多;最后集合CHI与IG两种算法得到一种集合特征选择方法(CCIF)。通过实验对比传统的卡方特征选择、信息增益和CCIF方法,CCIF方法使得算法的微平均查准率得到了明显的提高。

关 键 词:文本分类  特征选择  卡方统计  信息增益

Collective CHI and IG feature selection method
WANG Guang,QIU Yun-fei,SHI Qing-wei.Collective CHI and IG feature selection method[J].Application Research of Computers,2012,29(7):2454-2456.
Authors:WANG Guang  QIU Yun-fei  SHI Qing-wei
Affiliation:School of Software Engineering, Liaoning Technical University, Huludao Liaoning 125105, China
Abstract:In order to make the selected features distribute intensively in a certain class and make features appear in that certain class as many as possible, this paper added the two adjusted parameters to the originally traditional CHI-square feature selection and IG feature selection method through analyzing the relevance between features and classes. Then it proposed a collective feature selection methodCCIFby combining with CHI and IG feature selection. Experiments show that CCIF improves the Micro-Pmore apparently by comparing with the traditional CHI and IG feature selection method.
Keywords:text classification  feature weight  Chi-square statistic  information gain
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《计算机应用研究》浏览原始摘要信息
点击此处可从《计算机应用研究》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号