基于随机森林的K最近邻算法 |
| |
作者单位: | ;1.南昌工程学院理学院;2.西北农林科技大学理学院应用数学系 |
| |
摘 要: | 作为人工智能算法的经典算法之一,K最近邻(KNN)在非线性、低维数据时能够取得优越的效果。但是,当维数较高时,现有数据集往往会变得较为稀疏,此时KNN需要大量训练数据才能保证精度。因此,适当的数据降维方法是改进KNN方法的重要手段。先用随机森林对训练数据集的变量进行排序,从而建立一种有效的KNN算法,并采用Boston数据集验证了该模型的有效性。
|
关 键 词: | 随机森林 K最近邻 高维数据 |
K nearest neighbor algorithm based on random forest |
| |
Abstract: | |
| |
Keywords: | |
|
|