首页 | 官方网站   微博 | 高级检索  
     

基于Sas的时间序列缺失值处理方法比较
引用本文:兰妥,;江弋,;刘光生.基于Sas的时间序列缺失值处理方法比较[J].微机发展,2008(10):43-45.
作者姓名:兰妥  ;江弋  ;刘光生
作者单位:厦门大学信息学院计算机系,兰州大学资源环境学院
基金项目:基金项目:福建省自然科学基金资助项目(A031008)
摘    要:对于时间序列挖掘过程中的缺失值处理,目前有许多方法。在处理数据变量成一定的相关的数据集时,回归模型不失为较好的插补方法。利用均值插补、一元线性回归、多元线性回归、迭代回归方法对水文时间序列数据集的缺失数据进行处理,比较不同的皮氏相关系数下各方法的优劣及适用性。文中研究表明当数据集中存在与缺值变量相关度较大的变量时,一元线性回归的插补简单直观,且有较高的精度,结果接近真实;当数据集中不存在与缺值变量显著相关的自变量时,一元线性回归的结果变差,多元线性回归与多元迭代回归具有较好的结果,但多元迭代回归迭代次数难以确定,插补代价较大,多元线性回归为最佳选择;当缺值变量与其他自变量相关系数均较小时,回归插补的结果不理想,此时可考虑其他插补方法。

关 键 词:时间序列  皮氏相关系数  回归模型  迭代回归模型

Comparison of Methods on Time Series' Missing Value Based on Sas
LAN Tuo,JIANG Yi,LIU Guang-sheng.Comparison of Methods on Time Series' Missing Value Based on Sas[J].Microcomputer Development,2008(10):43-45.
Authors:LAN Tuo  JIANG Yi  LIU Guang-sheng
Affiliation:LAN Tuo1,JIANG Yi1,LIU Guang-sheng2
Abstract:There are many methods for dealing with missing value on time series data.When the variables of the data are correlative,the regression model is better than other methods.Handles missing value of hydrological by using mean interpolation,single linear regression,multiple linear regression and interative regression method.Shows that when the data set exists the variable which relates with given variable closely,the single linear regression is better than other methods.If the data set doesn't,multiple linear regression is best.If the pearson correlation between the given variable and other variables is small,may consider other interpolation method.
Keywords:time series  pearson correlation  one-stepregression model  iterative regression model
本文献已被 CNKI 维普 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号