首页 | 官方网站   微博 | 高级检索  
     

一种改进的降噪自编码神经网络不平衡数据分类算法
引用本文:张成刚,宋佳智,姜静清,裴志利. 一种改进的降噪自编码神经网络不平衡数据分类算法[J]. 计算机应用研究, 2017, 34(5)
作者姓名:张成刚  宋佳智  姜静清  裴志利
作者单位:内蒙古民族大学 数学学院; 内蒙古 通辽028000,东北师范大学 计算机科学与信息技术学院,内蒙古民族大学 计算机科学与技术学院; 内蒙古 通辽028000,内蒙古民族大学 计算机科学与技术学院; 内蒙古 通辽028000
基金项目:国家自然科学基金资助项目(61672301,61662057);内蒙古自然科学基金资助项目(2016MS0336);内蒙古民族大学科学研究项目(NMDYB1731);内蒙古自治区“草原英才工程”基金项目(2013);内蒙古自治区“青年科技领军人才”基金项目(NJYT-14-A09);内蒙古自治区“321人才工程”二层次人选基金项目(2010).
摘    要:针对少数类样本合成过采样技术(Synthetic Minority Over-Sampling Technique, SMOTE)在合成少数类新样本时会带来噪音问题,提出了一种改进降噪自编码神经网络不平衡数据分类算法(SMOTE-SDAE)。该算法首先通过SMOTE方法合成少数类新样本以均衡原始数据集,考虑到合成样本过程中会产生噪音的影响,利用降噪自编码神经网络算法的逐层无监督降噪学习和有监督微调过程,有效实现对过采样数据集的降噪处理与数据分类。在UCI不平衡数据集上实验结果表明,相比传统SVM算法,该算法显著提高了不平衡数据集中少数类的分类精度。

关 键 词:神经网络;过采样;不平衡数据;分类
收稿时间:2016-04-06
修稿时间:2017-03-07

An imbalanced data classification algorithm of improved de-noising auto-encoder neural network
Zhang Chenggang,Song Jiazhi,Jiang Jingqing and Pei Zhili. An imbalanced data classification algorithm of improved de-noising auto-encoder neural network[J]. Application Research of Computers, 2017, 34(5)
Authors:Zhang Chenggang  Song Jiazhi  Jiang Jingqing  Pei Zhili
Affiliation:College of Mathematics;Inner Mongolia University for the Nationalities,Tongliao Inner Mongolia 028000,College of Computer Science and Information Technology, Northeast Normal University,,College of Computer Science and Technology,Inner Mongolia University for the Nationalities,Tongliao Inner Mongolia 028000
Abstract:Aiming at the noise problems of SMOTE algorithm when synthesizing new minority class samples, the paper proposed a Stacked De-noising Auto-Encoder neural network algorithm based on SMOTE, SMOTE-SDAE. The proposed algorithm balances the original data sets by using SMOTE to synthesize new minority class samples, and then effectively de-noises and classifies the oversampling data sets through the layer-by-layer unsupervised de-noise learning and supervised fine-tuning process of de-noising auto-encoder neural network given the impact of noise produced in the process of synthesizing samples. Experimental results on UCI imbalanced data sets indicate that compared with traditional SVM algorithms, SMOTE-SDAE algorithm significantly improves the minority class classification accuracy of the imbalanced data sets.
Keywords:neural network   over-sampling   imbalanced data   classification  
点击此处可从《计算机应用研究》浏览原始摘要信息
点击此处可从《计算机应用研究》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号