基于大规模高维线性回归模型的分布式计算方法研究 |
| |
引用本文: | 潘莹丽,刘展,闫玲玲.基于大规模高维线性回归模型的分布式计算方法研究[J].应用数学学报,2022(3):339-354. |
| |
作者姓名: | 潘莹丽 刘展 闫玲玲 |
| |
作者单位: | 湖北大学数学与统计学学院应用数学湖北省重点实验室 |
| |
基金项目: | 国家自然科学基金(11901175)资助项目; |
| |
摘 要: | 大数据背景下挖掘大规模高维数据所隐藏的信息备受关注.本文主要目的是采用分布式优化方法解决加SCAD和Adaptive LASSO惩罚的高维线性回归中的参数估计和变量选择问题.主要方法是通过构造全局损失函数的一个交互有效的正则化替代损失函数,把基于全局损失函数的优化问题转化为基于替代损失函数的优化问题.本文设计的修正的ADMM算法,在计算上,只需要子机器基于局部数据计算梯度,而主机器进行参数估计和变量选择.在主从机器交互复杂度上,基于替代损失函数所得的估计误差收敛于基于全局损失函数所得的估计误差.通过模拟和实证研究进一步验证本文提出的分布式计算方法在实际生活中的可行性和实用性.
|
关 键 词: | 分布式优化 SCAD Adaptive LASSO 高维线性回归 修正的ADMM算法 |
|
|