改进随机森林算法在Spark+Kudu平台的并行化运用 |
| |
引用本文: | 庄巧蕙.改进随机森林算法在Spark+Kudu平台的并行化运用[J].信息技术与信息化,2024(2):67-70. |
| |
作者姓名: | 庄巧蕙 |
| |
作者单位: | 闽南理工学院 |
| |
摘 要: | 多种因素可能对学生成绩造成影响,利用数据挖掘工具对学生的学习课程成绩进行预测分析,进而利用预测分析结果及时指正学生出现的不良学习行为,同时检查老师的教学效果。首先将改进随机森林算法在大数据平台上进行并行化改进后进行实践。然后通过将提出的改进随机森林算法进行并行化,将其运用到Spark+Kudu大数据平台上进行仿真实验。最后算法并行化主要根据随机森林算法中的决策树划分策略以及模拟退火算法构建多种群策略来进行。实验结果证明并行化策略能够有效提升数据集的分类效率,大幅度缩短算法执行时间。
|
关 键 词: | 随机森林算法 Spark Kudu 决策树 模拟退火算法 |
|