首页 | 官方网站   微博 | 高级检索  
     

不平衡数据分类研究综述
引用本文:赵楠,张小芳,张利军.不平衡数据分类研究综述[J].计算机科学,2018,45(Z6):22-27, 57.
作者姓名:赵楠  张小芳  张利军
作者单位:西北工业大学计算机学院 西安710000,西北工业大学计算机学院 西安710000,西北工业大学计算机学院 西安710000
基金项目:本文受中央高校基本科研业务费专项资金(3102015JSJ0004),国家高技术研究发展计划(863)项目(2015AA015307),国家自然科学基金(61402370)资助
摘    要:在很多应用领域中,数据的类别分布不平衡,如何对其正确分类是数据挖掘和机器学习领域中的研究热点。经典的数据分类算法未考虑数据类别的不平衡性,认为类别之间的误分类代价相同,导致不平衡数据分类的效果不理想。针对数据分类的各个步骤,相继提出了不同的不平衡数据分类处理方法。对多年来的相关研究成果进行归类分析,从特征选择、数据分布调整、分类算法、分类结果评估等几个方面系统地介绍了相关方法,并探讨了进一步的探索方向。

关 键 词:不平衡数据分类  不平衡数据的特征选择  不平衡分类评估  数据分布调整  不平衡数据分类算法

Overview of Imbalanced Data Classification
ZHAO Nan,ZHANG Xiao-fang and ZHANG Li-jun.Overview of Imbalanced Data Classification[J].Computer Science,2018,45(Z6):22-27, 57.
Authors:ZHAO Nan  ZHANG Xiao-fang and ZHANG Li-jun
Abstract:Imbalanced data classification has been drawn significant attention from research community in last decade.Because of the assumption of relatively balanced class distribution and equal misclassification costs,most standard classifiers do not perform well with imbalanced data classification.In view of various phases of data classification,different imbalanced data classification methods have been proposed.The relevant research achievements over the years were analyzed,and various approaches with imbalanced data were introduced from the view of feature selection,adjustment of the data distribution,classification algorithm and classifier evaluation.The future trends and research issues that still need to be faced in imbalanced data classification were discussed in the end.
Keywords:Imbalanced data classification  Feature selection for imbalanced data  Imbalanced classification assessment  Adjustment of data distribution  Classification algorithm for imbalanced data
点击此处可从《计算机科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号