首页 | 官方网站   微博 | 高级检索  
     

一种适合大规模数据集的特征选择方法
引用本文:张莉,陈恭和.一种适合大规模数据集的特征选择方法[J].计算机工程,2007,33(4):184-186.
作者姓名:张莉  陈恭和
作者单位:对外经济贸易大学信息技术与管理工程学院,北京,100029;对外经济贸易大学信息技术与管理工程学院,北京,100029
摘    要:研究训练样本重要特征选择问题,提出了一种适合大规模数据集的特征选择方法。在不同的样本空间中利用特征相似性和浮动搜索方法的思想选择特征,基于互信息和分类准确度加权选择分类器,提出了基于Bagging选择性组合算法来提高特征选择算法稳定性。采用KDD Cup’99中的入侵检测数据对算法性能进行了验证。

关 键 词:特征选择  特征相似性  浮动搜索  选择性集成
文章编号:1000-3428(2007)04-0184-03
修稿时间:2006-02-20

A Feature Selection Method Fitting for Large Data Set
ZHANG Li,CHEN Gonghe.A Feature Selection Method Fitting for Large Data Set[J].Computer Engineering,2007,33(4):184-186.
Authors:ZHANG Li  CHEN Gonghe
Affiliation:(School of Information Technology & Management Engineering, University of International Business and Economics, Beijing 100029)
Abstract:This paper researches on problems of selecting important features and proposes a feature selection method fitting for large data set, selects feature subset using feature similarity, the idea of floating search method, and classifiers with the help of mutual information and accuracy weight, and propose a Bagging-based selective result ensemble algorithm to improve the algorithm stability. Intrusion detection data of KDD Cup’99 to validate the performance of algorithm is introduced.
Keywords:Feature selection  Feature similarity  Floating search  Selective ensemble
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程》浏览原始摘要信息
点击此处可从《计算机工程》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号