首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 312 毫秒
1.
徐海文  付振宇  傅强 《科学技术与工程》2020,20(34):14126-14132
针对离港航班延误预测问题,利用深度神经网络模型,结合时效航班信息数据和时效气象数据,提出了一种基于时效信息和深度学习的离港航班延误预测模型。利用真实数据开展数值试验,结果表明了所构建的延误预测模型可以在较短时间内获得较高的航班延误预测精度,并且具有较大的航班延误预测时效;同时随着延误时间阈值的增加,预测精度不断提高,损失值不断降低;尤其以60分钟为阈值时,模型的预测精度可以达到91.26%,说明了模型的有效性。  相似文献   

2.
近年来,天气预报中的空气质量预报成为大众尤为关心的热点,由于二氧化硫对空气质量水平变化的影响较大,因此准确预测二氧化硫的浓度变化尤为重要.采用XGBoost模型对Prophet模型的预测误差进行修正,建立改进的Prophet融合误差预测模型,对于空气质量中的关键指标二氧化硫进行时序预测.将时序数据输入Prophet模型,对Prophet生成的预测结果与源输入比较求出残差,构建关于残差的时序序列,利用XGBoost进行残差时序建模,获取残差的修正值,将修正值返回输入到Prophet模型.通过上述步骤,构建特定时序数据融合模型.实验数据表明,融合模型在预测结果中的平均绝对误差和均方根误差分别为1.08和1.38,与Prophet相比,误差指标分别降低2.47,2.45;与差分整合移动平均自回归模型相比,误差指标分别降低0.49,0.47;与XGBoost模型相比,误差指标分别降低0.54,0.52.证明融合模型的预测精度优于上述模型.  相似文献   

3.
针对神经网络分类模型对美国联邦运输统计局(Bureau of Transportation Statistics, BTS)航班数据集中的不均衡数据预测误差较大的问题,采用自适应合成采样算法(adaptive synthetic sampling approach, ADASYN)和合成少数类过采样算法(synthetic minority over-sampling technique, SMOTE)对航班延误类别进行平衡处理,并用随机森林(random forest, RF)模型进行训练和贝叶斯调参。结果表明:与不经过平衡采样的方法比较,该方法在权重平均下的精确率、召回率和F1评分分别提高了19%、8%和16%;分类预测准确率提升8.03%,模型拟合指数AUC(area under curve)提升5.4%。同时,采用多特征相融合的图神经网络模型Graph WaveNet对航班平均延误时间进行预测。实验结果表明:与单特征模型比较,该模型平均绝对误差和均方根误差分别降低了16%和12.45%。这些方法和结果对研究航班延误分类和预测算法研究具有参考价值。  相似文献   

4.
针对传统模型对心肺复苏结果预测准确率较低、模型可解释性较差,提出了一种基于多模型加权递归消除法(MW-REF)的心肺复苏结果预测模型,并在Shapley加法解释(Shapley additive explanation, SHAP)框架下分析影响心肺复苏结果的关键因素。采用了随机森林、GBDT、XGBOOST作为基模型,将其特征重要性得分加权后使用递归消除法过滤特征并对3种及模型采用Voting进行模型融合,利用五折交叉验证下的准确率作为最终特征选择标准。最后对最终特征数据集下的融合模型进行可解释性分析。实验结果表明,与传统的递归特征消除算法对比,该模型提升了心肺复苏结果预测的准确率,模型预测结果具有可解释性,可为临床诊断提供辅助,提高诊断效率与心肺复苏成功率。  相似文献   

5.
为了针对性地制定后续优化措施,以降低多机场终端区内航班延误所带来的不利影响,并提高多机场系统内各机场的运营效率,进行多机场终端区航班延误的预测研究。首先,考虑多机场终端区交通态势对航班延误的影响,在对多机场终端区交通态势进行分析的基础上,建立了6个描述终端区交通态势的指标。接着,构建反向传播(back propagation,BP)神经网络航班延误预测模型,将终端区交通态势指标、航班信息和天气环境数据等作为输入,航班延误时间作为输出,并利用粒子群优化算法(particle swarm optimization,PSO)优化BP神经网络进行训练。通过实例验证和分析,基于多机场终端区交通态势的航班延误预测能够有效提高预测准确率,同时,通过粒子群优化BP神经网络的预测模型预测准确率均高于一般的考虑交通态势的BP和遗传算法优化的BP神经网络模型(genetic algorithm and back propagation,GA-BP)。  相似文献   

6.
为提高电站光伏功率预测准确率,该文提出了改进特征选择的融合预测模型。首先耦合包裹式和过滤式方法筛选特征参数;然后根据气象特征分类构建XGBoost、LightGBM和MLP的单一模型;最后使用双隐藏层多层感知器(MLP)构建融合模型进行预测。实验结果表明,通过改进特征选择以及使用对非线性描述能力更佳的MLP融合算法,融合预测模型相比单一模型具有更高的预测准确率以及更强的泛化能力,可较好地满足短期光伏功率预测的需求。  相似文献   

7.
针对网络个人信用有效评分缺失的问题,分析了互联网信贷个人信用评估数据的特点,选用支持向量机、随机森林和XGBoost分别建立了信用预测模型,并对3种单一模型进行了投票加权融合. 基于互联网信贷数据的特点,在特征工程中对样本集特征进行了离散化、归一化和特征组合等处理. 为增加对比,对实验数据集进行了FICO评估核心Logistic回归分析. 实验结果表明:3种单一算法性能均优于Logistic回归,XGBoost表现优于支持向量机和随机森林模型,预测相对准确;投票融合模型的表现比单一模型更好,模型分辨能力更优秀,预测精度更高,更适用于互联网信贷个人信用评估.  相似文献   

8.
为提高水面蒸发量预测精度,提出一种基于小波包变换(WPT)、金豺优化(GJO)算法和极端梯度提升(XGBoost)算法相融合的水面蒸发量时间序列预测模型,通过云南省龙潭站、董湖站、西洋站1991—2021年逐月水面蒸发量时序数据对模型进行检验.首先介绍GJO原理,在不同维度条件下选取4个标准函数对GJO进行仿真测试,并与粒子群优化(PSO)算法的仿真结果作对比.其次采用小波包变换(WPT)对逐月水面蒸发量时序数据进行分解处理,构建XGBoost算法输入输出向量.最后引入GJO算法对XGBoost超参数进行调优,建立WPT-GJO-XGBoost模型对各子序列分量进行预测和重构,并构建WPT-PSO-XGBoost、WPT-GJO-SVM、WPT-PSO-SVM、WPT-XGBoost作对比分析模型.结果表明:在不同维条件下GJO算法寻优精度优于PSO算法.WPT-GJO-XGBoost模型对龙潭站、董湖站、西洋站水面蒸发量预测的平均绝对百分比误差分别为5.491%、4.943%、5.024%,平均绝对误差分别为4.70、3.37、3.39 mm,预测精度优于WPT-PSO-XGBoos...  相似文献   

9.
由于航班延误数据集类别分布不均,传统分类器的性能受到一定程度的制约。为了能够对到港航班延误情况进行精准预测,提出了一种基于合成少数类过采样技术算法(synthetic minority oversampling technique, SMOTE)和条件生成对抗网(conditional generative adversarial nets, CGAN)的航班延误预测模型。首先,利用SMOTE算法对原始数据集进行上采样,并融合经过训练的CGAN生成指定样本数据集,缓解原始数据集中某些类别样本量少和数据非平衡等问题;再次,采用XGBoost模型在四种模式训练集上进行训练和超参数寻优;最后,以K近邻、支持向量机和随机森林为基准模型进行性能对比分析。经试验分析,通过分类器在融合样本集的训练,整体上可以在一定程度上提高模型的泛化性,尤其在轻度延误和中度延误类别中提升较为明显,与不采用融合方法比较,宏平均下的Precision、Recall、F1-score值分别提升了0.16、0.29、0.24个百分点。实验结果表明,该方法能够有效地对航班延误非平衡数据进行建模,在保持模型整体性能较高的前提下,能够显著的提升少数类的预测能力,可以为空管、航空公司和机场等提供决策依据。  相似文献   

10.
为了有效地监管网络舆情,辅助管理人员进行决策,微博信息传播预测方法的研究具有重要应用价值。针对传统微博信息传播预测方法存在指标单一、预测效果较差问题,提出一种基于XGBoost模型的融合多特征微博信息传播预测方法。首先,分析微博传播网络和用户节点特性,提取出博主特征、微博内容特征、传播特征3类特征并构建数据集;接着,基于XGBoost方法分别构建微博累计转发量预测模型和微博最大转发深度预测模型;最后,通过模型在测试数据集上的平均绝对误差验证模型的预测效果。通过与线性回归等传统的预测方法比较分析可以看出,提出的预测方法能够取得良好的预测效果。  相似文献   

11.
随着物联网、大数据技术的深入发展,一型装备交付部队的同时,往往需同步提供数字孪生模型以优化视情维护过程。论文基于某型号飞机试飞数据,提出一种将机器学习技术用于飞机起落架着陆载荷预测模型构建的方法。以某型号飞机飞行参数为输入,以传感器实测的左起落架垂向载荷为输出,经数据清洗和特征降维后,分别建立极端梯度提升(extreme gradient boosting, XGBoost)、随机森林(Random Forest)和多层前馈(back propagation, BP)神经网络模型,并对所建模型进行调优。经对比和评估,XGBoost模型具有最高的预测精度,对起落架载荷绝大多数样本的预测误差均保持在6%以内,同时建模时间少,泛化能力强,为起落架载荷预测最优模型。  相似文献   

12.
魏东  杨洁婷  韩少然  朱准 《科学技术与工程》2023,23(29):12604-12611
针对建筑负荷预测模型特征选择工作量大、泛化能力提升难的问题,提出一种基于XGBoost-神经网络的建筑负荷特征筛选及预测方法,利用XGBoost算法训练滤波处理后的数据,基于平均绝对误差百分比MAPE确定最优特征子集,以改善模型精度和泛化能力;采用贝叶斯正则化算法训练前馈神经网络,以便能够在训练优化过程中降低网络结构复杂性,从而避免网络过拟合,进一步提升其泛化能力。针对某商业建筑的负荷预测实验结果表明,特征筛选后较筛选前模型MSE降低43.29%,有效提高了模型预测精度;分别以贝叶斯正则化和L-M算法对神经网络进行训练,前者5次试验RMSE和MAPE平均值较后者分别降低87.08%、85.33%,预测模型泛化能力得到有效提升。  相似文献   

13.
【目的】比较分析XGBoost模型、LightGBM模型、随机森林模型(RF)、K最近邻模型(KNN)、长短期记忆神经网络(LSTM)、决策树模型(DT)共6个PM2.5浓度预测模型,以准确、及时预测环境PM2.5浓度。【方法】基于重庆市合川区2020年全年空气质量监测数据和气象数据,通过最大相关最小冗余算法(MRMR)进行数据降维选择最优特征子集,作为模型的输入,逐一进行PM2.5浓度预测;考虑到不同季节PM2.5浓度差异较大,故分季节预测了PM2.5浓度;为了探究各模型预测性能,计算了各模型运行时间和内存占用,并基于PM2.5与特征变量的相关性和特征变量的重要性探讨了模型预测性能季节性差异原因。【结果】模型总体预测精度从高到低排序为 XGBoost、RF、LightGBM、LSTM、KNN、DT模型;预测性能方面,6个模型均表现为秋冬季节预测精度高于春夏季节;LightGBM模型可在保证模型精度的情况下,大幅减少模型训练时间和内存占用;特征重要性显示PM10浓度、气温和气压的重要性高,O3浓度、风向和NO2浓度重要性相对较弱。【结论】采取MRMR方法进行数据降维选取的最优特征子集能较好地预测PM2.5浓度;相比较而言,XGBoost、RF、LightGBM、LSTM模型在PM2.5浓度预测上具有较优性能,其中综合性能较好的为LightGBM模型。  相似文献   

14.
野火易发性评价对野火灾害的前期预防以及灾害管理决策的制定至关重要。目前野火易发性的研究主要集中于提高模型的预测精度,而往往忽略对模型的内部决策机制进行解释分析。为此,构建了一种基于可解释机器学习的野火易发性模型,并详细分析了各因子对野火易发性预测结果的影响。以南宁市历史野火样本为基础,综合考虑样本的空间分布特征,选取高程、归一化植被指数(normalized difference vegetation index, NDVI)、年均降雨和平均气温等18项评价因子,利用分类和回归树(calssification and regression tree, CART)、随机森林(random forest, RF)、轻量的梯度提升机(light gradient boosting machine, LGBM)和极致梯度提升(extreme gradient boosting, XGBoost)4种机器学习模型构建野火易发性预测模型。基于性能最优的易发性模型,运用沙普利加和解释(shapley additive explanations, SHAP)方法完成特征全局性解释、依赖性分析和典型样本...  相似文献   

15.
为深入挖掘驾驶人因素与交通事故之间的关系,提出一种基于SMOTENC和极端梯度提升(extreme gradient boosting, XGBoost)的驾驶人交通状态优劣分类算法。首先针对交通事故发生与否不平衡的特点,使用SMOTENC算法对数据进行上采样并在采样过程中加入随机扰动,解决了数据不平衡问题。然后使用Embedded算法结合L1正则化,通过模型评估完成对特征子集的选择。最后使用机器学习的方法将XGBoost算法用于执行数据的特征提取和分类过程。实验表明,在对驾驶人的交通状态进行综合评价的任务上,XGBoost模型的准确率为99.85%,相较于随机森林、支持向量机等对照组模型,提升了约1.12%-1.80%。除此之外,使用SMOTENC算法对数据不平衡问题进行处理后,通过混淆矩阵观察到模型对于好坏个体均具备较好的识别能力。  相似文献   

16.
唐中君  吴凡  倪浪 《科技促进发展》2020,16(10):1221-1229
电影首映日票房预测对该日排片、后续放映日票房及总票房有显著影响。在构建考虑竞争的电影首映日票房预测变量集的基础上,建立首映日票房集成预测模型。首先使用多元线性回归(multiple linear regression, MLR)、支持向量回归(support vector regression, SVR)、套索回归(Least absolute shrinkage and selection operator, Lasso)和极端梯度提升(Extreme Gradient Boosting, XGBoost)等算法建立基学习器,随后使用XGBoost算法作为原学习器构建堆栈集成预测模型,最后利用收集到的数据进行对比实验。实验证明,加入竞争变量的电影首映日票房预测变量集适用于首映日票房预测;相比单一模型,提出的集成预测模型的准确性、泛化性能和稳定性均有提升,相比较传统预测方法对首映日票房预测更准确。提出的集成预测模型有助于提升首映日票房排片的有效性。  相似文献   

17.
地震属性可以用来解释与预测地质构造,因此地震属性被广泛地运用在煤矿地质构造的识别。但一般情况下,勘探区中无构造区域与有构造区域分布不均衡,无构造区域远远多于有构造区域。机器学习中,传统的分类器更习惯于偏向多数类,这使得如何有效地识别出构造体成为一个难题。为了解决这一问题,提出了一种针对不平衡数据集的改进极限梯度提升(extreme gradient boosting, XGBoost)构造识别方法。该方法的原理是,首先,以基于三维地震勘探成果数据体提取的12种地震属性为数据集特征,以实际揭露后的地质构造为数据集标签构建多属性数据集,然后以特征对标签的相关性为标准,过滤掉冗余的特征;其次,将边界样本分类算法(boundary sample classification, BSC)与合成少数类过采样技术(synthetic minority over-sampling technique, SMOTE)相结合形成BSC-SMOTE算法。用BSC-SMOTE算法对原始数据集进行平衡,再利用平衡后的数据集训练XGBoost分类器,并用贝叶斯优化(Bayesian optimization, B...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号