基于持续同调的过滤式特征选择算法 |
| |
引用本文: | 殷杏子,彭宁宁,詹学燕.基于持续同调的过滤式特征选择算法[J].计算机科学,2023(6):159-166. |
| |
作者姓名: | 殷杏子 彭宁宁 詹学燕 |
| |
作者单位: | 武汉理工大学理学院 |
| |
基金项目: | 国家自然科学基金(11701438)~~; |
| |
摘 要: | 现有的过滤式特征选择算法忽略了特征之间的关联性。鉴于此,提出了一种新的过滤式特征选择算法——基于持续同调的特征选择算法(Rel-Betti算法),该算法能够识别特征之间的关联性以及组合效果。通过提出相关贝蒂数概念,筛选出数据集中重要的拓扑特征信息。该算法对数据集进行预处理后,根据类标签将数据集分类,计算不同类中的相关贝蒂数,获得数据信息的特征均值,按特征均值差值大小对特征进行重要性排序。利用UCI数据集中的8个数据,将该算法与其他常见算法在决策树、随机森林、K近邻和支持向量机这4种学习模型下进行比较实验。结果表明,该算法是一种有效的特征选择算法,其能够提高分类的准确率和F1值,并且不依赖于特定的机器学习模型。
|
关 键 词: | 特征选择 持续同调 条形码 贝蒂数 机器学习 |
|
|