首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 109 毫秒
1.
梯度提升决策树(GBDT)和支持向量机(SVM)是预测光伏出力的两种常用算法。分析了光伏发电出力的影响因素,介绍了GBDT算法和SVM算法的原理,以及基于两种算法的光伏出力预测模型的流程,并进行对比分析。实验结果表明,基于GBDT算法的光伏出力预测模型的平均绝对相对误差和均方根误差都较小,预测效果更好。  相似文献   

2.
针对目前高速公路检测器铺设密度较低导致预测路段旅行时间准确率不高的问题,利用联网收费数据建立旅行时间预测模型,用于预测路段旅行时间.首先根据收费数据计算出路段旅行时间,对其进行修正后建立真实旅行时间集,然后利用随机森林算法从构建的旅行时间备选变量中筛选出重要变量,以此作为输入建立基于BP神经网络的旅行时间预测模型,最后...  相似文献   

3.
针对现今客户价值的差异对企业服务运营的影响,本文基于对Superstore Sales客户消费数据的分析,提取客户特征构建基于消费行为的客户画像;抽取客户价值评价指标,经主成分分析法(PCA)优化后形成客户价值评价指标体系;利用K-Means聚类算法为客户贴上价值标签,构建基于梯度提升决策树算法(GBDT)的客户价值预测模型。实验结果表明,该方法预测结果具有较高的准确率,可挖掘隐藏的高价值客户,对于企业客户关系管理具有一定的研究借鉴价值与实际意义。  相似文献   

4.
随着移动服务的发展,越来越多的移动端服务基于对象的位置进行推送和推荐,因此位置预测技术显得越来越重要.由于对象位置信息存在采集不连续或对象行为不规律等因素,导致位置预测成为一项非常有挑战的工作.为了提高位置预测的准确性,提出一种基于K-Means算法和时间匹配的位置预测模型.该模型使用K-Means算法对历史位置点进行聚类,划分多个对象运动区域,针对对象运动区域进行预测.按照对象的作息时间将一天时间划分为多个时间段,运用笔者提出的轨迹建模算法和轨迹更新算法形成用户运动轨迹,形成对象运动轨迹,再使用时间匹配原则进行位置预测.笔者最后利用真实的数据实现该模型,实验证明:未使用该模型的位置预测准确率为39.7%;使用该模型后算法和时间匹配的位置预测模型预测准确率达到60.3%,准确率提高了20%左右.  相似文献   

5.
现有风电功率预测模型的主要输入特征包括气象数据和功率数据,高精度气象数据获取困难、数据间潜在关系难以表示、预测模型收敛缓慢,提出基于极端梯度提升回归树算法(XGBoost)扩展金融因子的超短期风电功率预测新方法,以及基于风电时序数据衍生金融因子的预测模型.采用具有较高预测准确率与较快训练速度的XGBoost算法进行预测,使得预测模型快速收敛.在中国内蒙古某风电场的风电功率数据集与德国Tennet公司风电功率数据集上进行实验验证.实验结果表明,以R2score为例,所提方法与基准方法相比提升约14.71%.所提方法中的建模与预测合计时间不超过500 ms.  相似文献   

6.
通过实验筛选研发新药的过程非常缓慢且需耗费大量的人力物力,而利用计算机辅助预测药物的分子性质可极大地节省药物研发时间和成本.因此,为了能够使抗乳腺癌候选药物对抑制ERα具有良好的生物活性和ADMET性质,针对收集到的1974种化合物,首先利用随机森林分类器筛选出前20个对生物活性最具显著影响的分子描述符,并以此和pIC50值作为特征数据建立QSAR模型.其次,基于PSO优化BP神经网络对50个新化合物的生物活性值进行预测,模型拟合度为0.8337,根均方误差为0.7315,比优化前的BP神经网络预测值更贴合实际.随后为提高药物研发的成功率,依据已有的ADMET性质数据利用PSO优化SVM构建ADMET分类预测模型,算法交叉验证CV准确率达到94.0767%,5个指标模型的预测准确率均在79%以上.结果表明,所建立的模型比基准模型的预测性能更好,采用的预测策略是有效的,可为抗乳腺癌药物的研发提供借鉴.  相似文献   

7.
针对当前基于第三方应用数据的用户属性预测算法较少考虑应用前台实际使用时长问题,提出了“手机应用前台均使用时长”特征,同时采用基于稀疏自编码器和神经网络的Co-training框架,充分利用大量未标注数据,从应用类别和前台均使用时长两个角度进行属性预测。实验进行时,首先使用未标注数据对网络进行初始化,然后采用基于准确率的梯度下降算法对参数进行更新。实验结果表明,本文算法提高了用户属性预测准确率。  相似文献   

8.
针对目前移动用户地点预测方法对时间的依赖性较强且在小数据集上表现差的问题,提出一种基于皮特曼-尤尔及移动马尔可夫链(PY-MMC)模型的下一步地点预测方法.该方法综合考虑目标用户轨迹的短时效应及幂律分布特征.以用户的时间位置熵为参考,计算可预测性因子.依据该因子对皮特曼-尤尔模型及移动马尔可夫链模型输出的概率线性加权,建立PY-MMC模型.利用新模型计算每个下一步候选地点的概率,并取最大者输出,完成下一步地点的预测.以"Geolife"及"Foursquare"数据集为例,采用一步准确率、一步候选准确率及平均准确率3个评估指标进行实验.结果表明:新方法能够有效克服基于MMC模型的预测方法准确率随时间波动较大的不足.同时,该方法解决了基于PY模型的预测方法对子序列长度过度依赖的问题.  相似文献   

9.
针对结直肠癌患者术后生存期预测,基于模糊C均值(FCM)聚类算法,提出一种结合场景认知和隶属度排序的变量聚类方法,对结直肠癌患者样本进行降维,并筛选出6个特征变量.结合BP神经网络,建立一个结直肠癌患者术后生存期预测模型.为了验证该模型的有效性,利用主成分分析(PCA)对样本进行降维,并训练BP神经网络,对比FCM模型及PCA模型的预测准确率.结果显示,基于FCM变量聚类的BP神经网络模型预测准确率更高,所提出的变量聚类方法能够有效筛选出对于生存期有相关性和解释性的变量,从而提高BP神经网络模型的预测准确率.  相似文献   

10.
针对目前大多数基于信息论的线性累加特征选择算法的缺点和不足,并且考虑到已选特征的动态变化对特征选择的影响,本文提出了一种非线性的特征选择算法。实验结果证明,本文算法在平均准确率和最高准确率上都取得了很好的效果。为证明本文算法的优势,将本文算法与7个极具竞争性的特征选择算法在3个不同的分类器和8个真实数据集上进行了比较,实验结果表明,本文算法具有较强的分类优势。  相似文献   

11.
针对PM2.5浓度的非线性和不确定性,提出了一种基于集成树-梯度提升决策树(EnsembleTrees-GBDT)的PM2.5预测模型.该模型首先在集成树框架下进行特征选择,即选取PM2.5浓度主要影响因素,使用算术均值聚合法计算出各项特征对PM2.5浓度增加的影响程度,并以影响程度由强到弱的次序排序;其次使用网格搜索对GBDT算法进行参数优化,选取树的深度等参数的最优值;最后构建完整的PM2.5浓度集成预测模型.使用北京市2015-2016年的污染物浓度和气象条件观测值2个数据集,对模型进行了预测仿真实验.对比实验结果表明,所提出的EnsembleTrees-GBDT预测模型相比于决策树、随机森林、支持向量机等模型,具有更低的平均绝对误差和均方根误差,同时具有更好的泛化能力,能够更准确地预测PM2.5浓度,并实现对PM2.5浓度影响因素的有效分析.  相似文献   

12.
车辆在执行换道行为时,由于受到较多环境因素影响,难以准确进行换道识别和预测. 为解决这一问题,提出一种基于梯度提升决策树(GBDT)进行特征变换的融合换道决策模型,以仿真驾驶员在高速公路上自由换道时的决策行为. 采用主体车辆与目标车道后车的碰撞时间 tlag 及车辆周围交通状态变量进行车辆换道行为的建模分析,在NGSIM数据集上对建立的融合换道决策模型进行参数标定和模型测试. 实验结果表明:融合换道决策模型以95.45%的预测准确率超越支持向量机、随机森林和GBDT等单一的换道决策模型,获得了最突出的表现. 变量分析结果表明:新引入的换道决策变量 tlag 对车辆换道行为具有重要影响. 提出的融合换道决策模型能够进一步减少因换道决策误判而导致的交通事故.  相似文献   

13.
为了研究高速公路目标车道领跟车在交织区与汇合车辆的交互作用,基于梯度提升决策树(GBDT)建立交织区汇合交互作用模型. 引入目标车道领跟车与前车、后车和汇合车辆的速度差、时间间隙、冲突评价指标及横向位置,分析汇合车辆与领跟车之间的交互行为. 利用美国NGSIM数据集中目标车道领跟车与汇合车辆的轨迹数据对模型进行训练和测试,比较不同损失函数对模型的拟合效果,对汇合加速度进行偏效应分析. 研究结果表明,基于平方损失函数(LS)的GBDT模型精度高于基于最小绝对偏差(LAD)和胡贝尔 (Huber-M) 损失函数的模型. 在汇合行为的各研究对象中,汇合车辆的预测精度高于领跟车,汇合车辆的横向位置在汇合交互作用中的影响程度最高. GBDT模型用于汇合交互行为不仅可以准确预测目标车道领跟车与汇合车辆之间的交互作用,也能够获取影响变量与加速度之间隐藏的非线性关系.  相似文献   

14.
Slope stability prediction research is a complex non-linear system problem. In carrying out slope stability prediction work, it often encounters low accuracy of prediction models and blind data preprocessing. Based on 77 field cases, 5 quantitative indicators are selected to improve the accuracy of prediction models for slope stability. These indicators include slope angle, slope height, internal friction angle, cohesion and unit weight of rock and soil. Potential data aggregation in the prediction of slope stability is analyzed and visualized based on Six-dimension reduction methods, namely principal components analysis (PCA), Kernel PCA, factor analysis (FA), independent component analysis (ICA), non-negative matrix factorization (NMF) and t-SNE (stochastic neighbor embedding). Combined with classic machine learning methods, 7 prediction models for slope stability are established and their reliabilities are examined by random cross validation. Besides, the significance of each indicator in the prediction of slope stability is discussed using the coefficient of variation method. The research results show that dimension reduction is unnecessary for the data processing of prediction models established in this paper of slope stability. Random forest (RF), support vector machine (SVM) and k-nearest neighbour (KNN) achieve the best prediction accuracy, which is higher than 90%. The decision tree (DT) has better accuracy which is 86%. The most important factor influencing slope stability is slope height, while unit weight of rock and soil is the least significant. RF and SVM models have the best accuracy and superiority in slope stability prediction. The results provide a new approach toward slope stability prediction in geotechnical engineering.  相似文献   

15.
针对传统预测模型已不再适用于卫星网络的问题,提出了一种自适应步长和自适应核宽度的核最小均方算法(AKLMS).通过核函数将非线性数据从低维输入空间映射到高维特征空间进行操作,并且在迭代过程中根据瞬时误差自适应地调整步长和核宽度.仿真结果证明,与核最小均方算法(KLMS)和最小均方算法(LMS)相比,AKLMS算法在收敛速度和预测流量精度方面都有大幅提升,为卫星网络的流量规划和路由设计提供了强有力的决策支持.  相似文献   

16.
基于APSO-WLSSVR的水质预测模型   总被引:2,自引:1,他引:1  
为解决传统预测方法和标准最小二乘支持向量回归机(least squares support vector regression, LSSVR)在水质预测中存在预测精度低、鲁棒性差等问题,提出了自适应粒子群优化加权最小二乘支持向量回归机(adaptive particle swarm optimization weighted least squares support vector regression, APSO-WLSSVR)的水质预测模型。根据样本对模型重要性不同为各样本赋予不同权重,建立了加权最小二乘支持向量回归机(weighted least squares support vector regression, WLSSVR),实现对样本数据“重近轻远” 的优化选择,避免标准LSSVR算法因没有考虑样本重要性差异致使预测精度低的问题;采用自适应粒子群优化算法对模型参数组合进行优化选择,克服了标准LSSVR算法因试凑法获取参数的盲目性和人为因素的影响。为验证该模型的性能,对江苏省宜兴市集约化河蟹养殖水质进行预测,并与其他预测方法对比分析,结果表明该模型预测精度明显提高,还具有较好的鲁棒性和泛化能力,能够满足集约化水产养殖水质管理的实际需要。  相似文献   

17.
为了解决变种恶意代码、未知威胁行为恶意分析等问题,研究了基于梯度提升树的恶意代码分类方法,从大量样本中学习程序行为特征和指令序列特征,实现了智能恶意代码分类功能.将GBDT算法引入恶意代码检测领域,使模型结果行为序列具有可解释性,对恶意代码的检测能力大幅提高.GBDT算法能够客观地反映恶意代码的行为和意图本质,能够准确识别恶意代码.  相似文献   

18.
大样本高维度状态监测数据对剩余使用寿命(RUL)精准预测有着技术性挑战,为了提高以航空涡轮风扇发动机为代表的复杂装备的预测精度和收敛效率,提出一种两阶段的选择性深度神经网络集成方法. 第1阶段为多方法联合扰动下的候选集生成方案,通过采用异质神经网络结构、多时间尺度设计和算法参数随机化消除模型内部耦合关系,强化候选深度神经网络集多样性;第2阶段利用遗传算法集成修剪冗余模型,有效剔除性能不佳的冗余学习器,以获取多样化最优候选子集,并按平均集成输出预测结果. 与个体模型的数据实验对比表明,所提方法通过同步增强集成模型准确性和多样性,提升了近20%的RUL预测精度,可为运维决策提供有力支撑.  相似文献   

19.
基于特征合成的周期性备件需求预测方法Symbol`@@   总被引:1,自引:0,他引:1  
针对工程机械备件需求预测准确性低的问题,提出一种新的基于特征合成的周期性维修备件需求预测方法. 定义等间隔备件需求样本集的相似度模型,采用优化算法确定最优备件需求周期长度,并利用回归模型建立各周期内的备件需求模型;提出基于特征合成的模型综合方法,借鉴物理力学中的矢量合成方法,将多个历史备件周期需求模型特征矢量合成新的特征矢量,利用新特征矢量还原获得最优的周期预测模型,该模型综合考虑了各个历史备件周期预测模型,使获得的备件周期预测模型具有更好的鲁棒性和泛化性. 采用人工数据和矿用圆环链的实际需求数据对该预测模型进行验证,实验结果表明,该模型具有良好的稳定性和准确性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号