首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
本文给出了自适应Lasso的众数回归模型,用来对众数回归模型的变量进行选择.对比传统的均值回归模型和中位数回归模型,众数回归在解决重尾、多峰分布问题时更加稳健.众数回归模型的主要估计方法是核估计方法,当自变量的数目较大时,该方法会产生难以忽略的计算误差.本文在核估计方法的众数回归模型基础上添加惩罚项,并通过自适应Lasso方法进行参数估计,有效的剔除了贡献率低的自变量,同时提高了计算的准确性.本文详细阐述了该计算方法,并在一些正则条件下,给出了模型的参数的估计方法和估计值的渐近正态性.模拟实验和实证分析研究了所提方法在有限样本下的性质.对比均值回归模型和传统的众数回归模型,添加自适应Lasso惩罚项的众数回归模型极大地提高了参数估计的准确性.  相似文献   

2.
改进的自适应Lasso方法在股票市场中的应用   总被引:1,自引:0,他引:1  
《数理统计与管理》2019,(4):750-760
在金融领域,自适应Lasso被广泛的用于股票价格预测模型中的变量选择和参数估计。然而,自适应Lasso是针对非时间序列模型提出的,忽略了时间序列模型特定的结构,比如时间序列模型中通常会出现滞后阶数越靠后,对未来的预测能力越弱的特性,从而,容易造成估计及预测不精确。因此,时间序列模型的变量选择惩罚参数的设计应与滞后阶数相关,即对越靠后的滞后阶数应加上越大的惩罚。为了充分考虑时间序列模型的特性且保留自适应Lasso的优点,本文针对时间序列AR(p)模型提出一种改进的自适应Lasso(MA Lasso)方法,通过在自适应Lasso惩罚基础上乘以一个关于滞后阶数单调不减的函数来达到目标。这样设计的惩罚参数的另一个优点是通过选取特定的惩罚参数,Lasso,自适应Lasso方法都是MA Lasso方法的特例。进一步,对于AR(p)模型中另一个重要参数p的选择问题,本文提出一种改进的BIC模型准则来选择p。最后,将MA Lasso方法应用到中证100指数中,实证分析表明,与Lasso和自适应Lasso相比,MA Lasso选择最简模型且预测效果最佳,即选择最少的预测变量的同时且具有最小的模型预测误差。  相似文献   

3.
为了拟合纵向数据和其他相关数据,本文提出了变系数混合效应模型(VCMM).该模型运用变系数线性部分来表示协变量对响应变量的影响,而用随机效应来描述纵向数据组内的相关性, 因此,该模型允许协变量和响应变量之间存在十分灵活的泛函关系.文中运用光滑样条来估计均值部分的系数函数,而用限制最大似然的方法同时估计出光滑参数和方差成分,我们还得到了所提估计的计算方法.大量的模拟研究表明对于具有各种协方差结构的变系数混合效应模型,运用本文所提出的方法都能够十分有效地估计出模型中的系数函数和方差成分.  相似文献   

4.
本文在竞争风险数据下提出一种灵活的含变系数的可加可乘的子分布风险率模型.通过对删失时间的风险函数建立Cox比例风险模型,得到调整后的与协变量相依的权重,在新权重下建立估计方程来估计模型参数,并获得了估计的大样本性质,同时提出了模型中协变量的时变效应的检验方法.通过数值模拟验证了所提方法的有限样本性质,结果表明所提方法可以大大降低估计偏差.最后,分析了一组淋巴滤泡细胞的竞争风险数据集来展示所提方法的实际应用效果.  相似文献   

5.
针对存在缺失数据的超高维可加分位回归模型,本文提出一种有效的变量筛选方法.具体而言,将典型相关分析的思想引入到最优变换的最大相关系数,通过协变量和模型残差最优变换后的最大相关系数重要变量的边际贡献进行排序,从而进行变量筛选.然后,在筛选的基础上,利用稀疏光滑惩罚进一步做变量选择.所提变量筛选方法有三点优势:(1)基于最优变换的最大相关可以更全面的反映响应变量对协变量的非线性依赖结构;(2)在迭代过程中利用残差可以获取模型的相关信息,从而提高变量筛选的准确度;(3)变量筛选过程和模型估计分开,可以避免对冗余协变量的回归.在适当的条件下,证明了变量筛选方法的确定性独立筛选性质以及稀疏光滑惩罚下估计量的稀疏性和相合性.同时,通过蒙特卡罗模拟给出了所提方法的表现并通过一组小鼠基因数据说明了所提方法的有效性.  相似文献   

6.
研究了数据右删失时威布尔分布刻度参数依赖于协变量情形下模型参数的估计问题,通过EM算法求解参数的极大似然估计.详细给出E步推导过程的同时,利用稳定的Gauss-Seidel迭代来实现M步.文章通过计算机模拟考察了所提方法在不同删失比例下的表现,并通过实例分析展示了该方法的应用.  相似文献   

7.
本文提出了恢复Gauss关联结构(copula)图模型的充分降维方法,该方法在超高维情形下具有很高的计算效率.本质上,充分降维是通过对利用非参数方法估计的相关系数矩阵进行截断来实现的.本文给出了所提方法的理论性质,保证其所估计的边集合以概率趋于1覆盖所有真实存在边的集合.数值模拟研究发现,本文所提方法与现存方法相比有相近的估计表现,而计算效率却更高.最后分析了一组基因数据来展示本文所提方法的实际应用表现.  相似文献   

8.
冯海林  罗倩倩 《应用数学》2020,33(1):209-218
左截断数据是一类具有特殊结构的缺失数据,当且仅当研究变量大于一定的阈值时才能取得观察值.本文针对左截断数据下的非线性回归模型,提出了加权分位数估计方法,利用加权方式处理左截断缺失数据,取得了与完整数据相近的估计结果.并在一定假设条件下,证明了所提估计方法的一致性和渐近正态性等大样本性质,最后通过数值模拟展现所提估计方法的有限样本表现.  相似文献   

9.
本文在多种复杂数据下, 研究一类半参数变系数部分线性模型的统计推断理论和方法. 首先在纵向数据和测量误差数据等复杂数据下, 研究半参数变系数部分线性模型的经验似然推断问题, 分别提出分组的和纠偏的经验似然方法. 该方法可以有效地处理纵向数据的组内相关性给构造经验似然比函数所带来的困难. 其次在测量误差数据和缺失数据等复杂数据下, 研究模型的变量选择问题, 分别提出一个“纠偏” 的和基于借补值的变量选择方法. 该变量选择方法可以同时选择参数分量及非参数分量中的重要变量, 并且变量选择与回归系数的估计同时进行. 通过选择适当的惩罚参数, 证明该变量选择方法可以相合地识别出真实模型, 并且所得的正则估计具有oracle 性质.  相似文献   

10.
基于逆概率加权方法研究了响应变量缺失下非线性回归模型的参数估计问题,提出了一种利用广义部分线性单指标模型对选择概率建模的加权半参数估计方法.从理论上证明了所得估计量具有渐近正态性,并通过数据模拟分析研究了所提方法在有限样本下的表现.  相似文献   

11.
纵向数据常常用正态混合效应模型进行分析.然而,违背正态性的假定往往会导致无效的推断.与传统的均值回归相比较,分位回归可以给出响应变量条件分布的完整刻画,对于非正态误差分布也可以给稳健的估计结果.本文主要考虑右删失响应下纵向混合效应模型的分位回归估计和变量选择问题.首先,逆删失概率加权方法被用来得到模型的参数估计.其次,结合逆删失概率加权和LASSO惩罚变量选择方法考虑了模型的变量选择问题.蒙特卡洛模拟显示所提方法要比直接删除删失数据的估计方法更具优势.最后,分析了一组艾滋病数据集来展示所提方法的实际应用效果.  相似文献   

12.
本文研究测量误差模型的自适应LASSO(least absolute shrinkage and selection operator)变量选择和系数估计问题.首先分别给出协变量有测量误差时的线性模型和部分线性模型自适应LASSO参数估计量,在一些正则条件下研究估计量的渐近性质,并且证明选择合适的调整参数,自适应LASSO参数估计量具有oracle性质.其次讨论估计的实现算法及惩罚参数和光滑参数的选择问题.最后通过模拟和一个实际数据分析研究了自适应LASSO变量选择方法的表现,结果表明,变量选择和参数估计效果良好.  相似文献   

13.
利用正则化方法来进行变量选择是近年来研究的热点.在实际应用中解释变量常常以组的形式存在,通常我们希望将重要的组和组内重要的协变量选择出来,即双重变量选择.基于两种非凸惩罚函数SCAD和MCP,分别提出了稀疏Group SCAD和稀疏Group MCP估计方法,通过分块坐标下降迭代算法,达到组内和组间变量同时稀疏的效果.数值模拟结果表明本文提出的两种方法在模型预测和变量选择能力上优于Group Lasso和稀疏Group Lasso算法.并将该算法有效地应用于实际的初生儿体重数据集分析中.  相似文献   

14.
许多大型队列研究的主要预算和成本通常来自昂贵的关键协变量的采集与测量.在有限的预算或者时间下,观测大型队列中所有研究对象的昂贵协变量往往是不可行和低效的.因此,研究人员一直致力于寻找和使用能节约成本并能达到预设效率的抽样设计方法.对于生存数据,病例队列设计正是这样一种具有成本效益的有偏抽样机制.进一步,在病例队列研究中,为了利用更多的数据先验信息来提高研究的效率,可以在统计建模过程中对模型参数进行合理的假设和约束.本文研究病例队列设计下带约束的Cox模型中参数的估计方法.我们提出了一种加权约束估计的方法,并建立了所提出估计的渐近理论.发展了一种新的约束MM算法来实现所提出的加权约束估计的数值计算.通过统计模拟研究评估了所提出方法在有限样本量下的表现.分析了一个肾母细胞瘤的实际数据来展示所提出方法的实际应用价值.  相似文献   

15.
纵向数据常常用正态混合效应模型进行分析.然而,违背正态性的假定往往会导致无效的推断.与传统的均值回归相比较,分位回归可以给出响应变量条件分布的完整刻画,对于非正态误差分布也可以给稳健的估计结果.本文主要考虑右删失响应下纵向混合效应模型的分位回归估计和变量选择问题.首先,逆删失概率加权方法被用来得到模型的参数估计.其次,结合逆删失概率加权和LASSO惩罚变量选择方法考虑了模型的变量选择问题.蒙特卡洛模拟显示所提方法要比直接删除删失数据的估计方法更具优势.最后,分析了一组艾滋病数据集来展示所提方法的实际应用效果.  相似文献   

16.
当真实的潜在模型具有稀疏表示时通常需要使用变量选择方法,确定模型中的重要预测因子可提高被拟合模型的预测性能,许多文献研究了这类问题,其中张和吕[1]针对右删失数据开发了一种基于比例风险模型的变量选择方法.本文研究了基于当前状态数据的加法风险模型的变量选择问题.在文献[1]的启发下,我们提出一种自适应Lasso方法来解决...  相似文献   

17.
对于高维空间数据,利用半参数空间自回归进行建模,模型中会同时存在内生性、非线性、变量过多等问题。本文研究半参数空间分位回归模型,提出了新的估计程序:首先利用样条基函数,对模型中未知平滑函数进行逼近,解决非线性问题;然后运用特征向量空间滤波,将空间滞后因子转化为空间代理变量的线性组合,有效解决了内生性问题;利用再中心化影响函数,进行无条件分位回归建模,能够刻画不同分位水平下变量之间的关系;最后引入自适应Lasso惩罚,对高维线性部分进行变量选择,得到系数的稀疏估计,有效增强了模型的可解释性。数值模拟中对参数作不同的设置,展现了本文提出方法的有效性。最后,利用半参数空间分位回归模型分析了住房销售价格数据集。  相似文献   

18.
何晓霞  徐伟  李缓  吴传菊 《数学杂志》2017,37(5):1101-1110
本文研究了基于面板数据的分位数回归模型的变量选择问题.通过增加改进的自适应Lasso惩罚项,同时实现了固定效应面板数据的分位数回归和变量选择,得到了模型中参数的选择相合性和渐近正态性.随机模拟验证了该方法的有效性.推广了文献[14]的结论.  相似文献   

19.
可加模型通过协变量函数对响应变量起作用,是更加灵活的非参统计模型.当协变量个数大于样本数且以指数阶增大时,将维数降到经典方法可解决的范围是统计学家急需解决的问题.本文研究了超高维数据可加模型的变量筛选问题,提出了边际经验似然变量筛选方法.该方法通过排列在0点的边际经验似然率选择变量.我们证明了选择变量集以概率1渐进包含真实变量集;提出了迭代边际经验似然变量筛选方法.数据模拟和实数据分析验证了所提方法的可行性.  相似文献   

20.
本文针对带有组结构的广义线性稀疏模型,引入布雷格曼散度作为一般性的损失函数,进行参数估计和变量选择,使得该方法不局限于特定模型或特定的损失函数.本文比较研究了Ridge,SACD,Lasso,自适应Lasso,组Lasso,分层Lasso,自适应分层Lasso和稀疏组Lasso共8种惩罚函数的特点和引入模型后参数估计和...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号