首页 | 官方网站   微博 | 高级检索  
     

结合ReliefF和互信息的多标签特征选择算法
引用本文:陈平华,黄辉,麦淼,周宏虹.结合ReliefF和互信息的多标签特征选择算法[J].广东工业大学学报,2018,35(5):20-25,50.
作者姓名:陈平华  黄辉  麦淼  周宏虹
作者单位:1. 广东工业大学 计算机学院, 广东 广州 510006;2. 广东南方报业传媒集团有限公司, 广东 广州 510601;3. 广东省科技创新监测研究中心, 广东 广州 510033
基金项目:国家自然科学基金资助项目(61572144);广东省科技计划项目(2013B091300009,2014B070706007,2017B030307002)
摘    要:针对传统单标签特征选择算法不能直接应用于多标签数据的问题,提出一种多标签特征选择算法——MML-RF算法.在ReliefF的基础上,MML-RF算法提出新的类内最近邻样本查找方式,并结合多标签的贡献值改进特征权值的计算方法,能很好地适应多标签数据的特点;同时为了减少特征冗余,MML-RF算法以互信息作为特征冗余度量方式,提出一种去冗余方法,能够得到更小的特征子集.实验表明,MML-RF多标签特征选择算法得到的特征子集规模较小,且在多标签数据集上具有很好的分类效果,能够提升多标签学习和数据挖掘工作的效率.

关 键 词:特征选择  多标签学习  ReliefF  互信息  特征冗余  
收稿时间:2018-01-29

Multi-label Feature Selection Algorithm Based on ReliefF and Mutual Information
Chen Ping-hua,Huang Hui,Mai Miao,Zhou Hong-hong.Multi-label Feature Selection Algorithm Based on ReliefF and Mutual Information[J].Journal of Guangdong University of Technology,2018,35(5):20-25,50.
Authors:Chen Ping-hua  Huang Hui  Mai Miao  Zhou Hong-hong
Affiliation:1. School of Computers, Guangdong University of Technology, Guangzhou 510006, China;2. Guangdong Nanfang Media Group, Guangzhou 510601, China;3. Guangdong Science and Technology Innovation Monitoring and Research Center, Guangzhou 510033, China
Abstract:In view of the problem that the traditional feature selection algorithm can not be applied to the multi-label learning context, a MML-RF algorithm is presented. The MML-RF improves the way of defining and searching nearest neighbor on the basis of the ReliefF, and introduces a new parameter to consider the contribution values of different labels. The improved weighting formula enables MML-RF to be used to the multi-label dataset. MML-RF algorithm makes use of mutual information as the measure of feature redundancy, and puts forward a solution to redundancy, which can get smaller subset of features. Experiments show that the feature subset of MML-RF is smaller, and has good classification effect on multi-label dataset, which can further enhance the efficiency of subsequent multi-label learning and data mining.
Keywords:feature selection  multi-label learning  ReliefF  mutual information  feature redundancy  
点击此处可从《广东工业大学学报》浏览原始摘要信息
点击此处可从《广东工业大学学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号