基于Stacking集成学习的近红外光谱油页岩含油率预测 |
| |
引用本文: | 李泉伦,陈争光,焦峰.基于Stacking集成学习的近红外光谱油页岩含油率预测[J].光谱学与光谱分析,2023(4):1030-1036. |
| |
作者姓名: | 李泉伦 陈争光 焦峰 |
| |
作者单位: | 1. 黑龙江八一农垦大学信息与电气工程学院;2. 黑龙江八一农垦大学农学院 |
| |
基金项目: | 国家自然科学基金项目(41977202);;黑龙江省高校科研基本业务经费项目(ZRCPY202214)资助; |
| |
摘 要: | 为了克服单一模型预测精度很难进一步提高的不足,利用近红外光谱分析结合基于Stacking框架的异构集成学习模型实现对油页岩含油率的检测。以松辽盆地某区块所取230个油页岩岩芯样本为研究对象,使用低温干馏法测量油页岩样本的含油率,同时扫描每个样本对应的近红外光谱数据。样本使用蒙特卡洛算法进行异常样本剔除,将剔除异常样本后的213个数据按照3∶1的比例随机划分为训练集和预测集。利用去趋势加基线校正方法进行预处理消除光谱数据中噪声和基线漂移,利用随机森林算法进行波长重要性排序并保留重要波长,在此基础上采用CARS算法进行特征波长提取,进一步降低数据维度。最后,构建以PLS, SVM, RF和GBDT为初级学习器,PLS回归模型为次级学习器的Stacking集成学习模型,各初级学习器模型参数使用网格搜索进行寻优。使用决定系数和预测均方根误差作为各模型的评价指标,探究单一模型和集成学习模型对油页岩含油率预测的准确性。研究结果表明,RF-CARS方法能够有效筛选重要波长,进而提高模型效率。基于Stacking的异构集成学习模型与单一模型(SVM和PLS)和同构集成学习模型(RF和GBDT)相比有更...
|
关 键 词: | 近红外光谱 集成学习 油页岩含油率 特征波长 随机森林特征选择 |
|