首页 | 官方网站   微博 | 高级检索  
     

基于自适应密度邻域关系的多标签在线流特征选择
引用本文:张海翔,李培培,胡学钢.基于自适应密度邻域关系的多标签在线流特征选择[J].计算机技术与发展,2024(1):23-29.
作者姓名:张海翔  李培培  胡学钢
作者单位:1. 蚌埠医学院附属合肥市第二人民医院讯息处;2. 合肥工业大学大数据知识工程教育部重点实验室
基金项目:国家自然科学基金资助项目(61976077,62076085,62120106008);
摘    要:流特征选择指从以流形式到来的特征数据中选出最优特征子集,现有方法大多在模型训练中需要事先学习领域信息并预设给定参数值。实际应用中,由于不同的数据集数据结构和来源不同,在模型学习过程中研究人员无法提前获取相关领域知识且针对不同类型数据集指定一个统一参数存在巨大挑战。基于此,提出一种基于自适应密度邻域关系的多标签在线流特征选择方法(multi-label online stream feature selection based on adaptive density neighborhood relation, ML-OFS-ADNR),基于邻域粗糙集理论,所提方法在特征依赖计算时无需任何先验领域信息。此外,提出了一种新的自适应密度邻域关系,使用周围实例的密度信息,可以在流特征选择过程中自动选择适当数量的邻域,不需要事先指定任何参数。通过模糊等价约束,ML-OFS-ADNR可以选择高依赖低冗余度的特征。实验表明在10种不同类型的数据集上,所提方法在特征数量相同的情况下优于传统特征选择方法和先进的在线流特征选择方法。

关 键 词:多标签分类  流特征  邻域粗糙集  自适应密度邻域  在线流特征选择
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号