LASSO是无偏的还是有偏的?

  统计/机器学习 回归分析    浏览次数:5543        分享
2

LASSO是无偏的还是有偏的?怎么理解回归中的有偏或者无偏呢?

 

ljljlj   2018-06-23 10:46



   2个回答 
3

$\beta_{LASSO}=\underset{\beta}{\mathrm{argmin}}||y-X\beta||^2+\lambda|\beta|_1$

当$\lambda=0$时,没有限制(shrinkage),此时无偏;

当$\lambda$增大时,bias增大,variance减小;

当$\lambda$减小时,bias减小,variance增大。

看到有个说法(我没验证过),当添加先验知识从而减小自由度(degree of freedom)时,估计就是有偏的。LASSO的自由度是非零参数个数。

一个简单的例子,当y和X都是高斯分布,第一个项(似然函数项)得到$\beta$的估计是无偏,再加一个有偏的第二项(先验知识项,会迫使所有$\beta=0$,显然是有偏的),最后结果就是有偏的。

SofaSofa数据科学社区DS面试题库 DS面经

Zealing   2018-06-30 02:05

0

bias是从estimator的角度来说的。

其实LASSO和Ridge,甚至说所有有penalty的回归都是biased,不然会违背高斯-马尔可夫定理。

SofaSofa数据科学社区DS面试题库 DS面经

okayguy   2018-07-18 13:41



  相关讨论

Lasso的自由度是多大?

Ridge回归的解析解是什么?

什么时候该用LASSO,什么时候该用Ridge?

L2-norm为什么会让模型变得更加简单?

坐标下降法求LASSO问题怎样执行

关于lasso和ridge的区别

Lasso是对数值大的系数压缩大还是数值小的系数压缩大?

惩罚系数不变,特征变大,是不是更容易被Lasso去除?

Ridge,Lasso,ElasticNet的目标函数分别是什么?

lasso path是什么意思?

  随便看看

随机平均梯度法(Stochasitc Average Gradient)和随机梯度下降(SGD)有什么区别

怎么理解推荐系统中的NDCG?

推荐系统有哪些常用的评价标准

样本权重大小不同时,用什么分类算法比较合适?

推荐开放数据库