查看sklearn的线性回归系数的p value

  统计/机器学习 假设检验 回归分析 Python    浏览次数:2260        分享
4

不管是逻辑回归也好,线性回归也好,sklearn的线性模型只能查看每个变量的系数,有没有什么方法也可以像R里面那样查看系数的p value和显著性?

谢谢!


 

waccam   2017-10-12 11:18



   2个回答 
6

可以用statsmodel.api模块。比如说逻辑回归

>>> import statsmodels.api as sm
>>> log_reg = sm.Logit(df['y'], df[['a', 'b', 'c']])
>>> clf = log_reg.fit()
Optimization terminated successfully.
         Current function value: 0.692762
         Iterations 3

如果要查看系数的p value,调用clf.summary()就可以了,这个方法对OLS回归也是一样的。

>>> clf.summary()
Logit Regression Results
Dep. Variable:  y   No. Observations:   1000
Model:  Logit   Df Residuals:   997
Method: MLE Df Model:   2
Date:   Tue, 17 Oct 2017    Pseudo R-squ.:  -0.1341
Time:   10:19:37    Log-Likelihood: -692.76
converged:  True    LL-Null:    -610.86
                LLR p-value:    1.000
     coef    std err z   P>|z|   [95.0% Conf. Int.]
a   0.1240  0.219   0.565   0.572   -0.306 0.554
b   -1.9466 6.245   -0.312  0.755   -14.186 10.293
c   3.7477  6.230   0.602   0.547   -8.463 15.958


SofaSofa数据科学社区DS面试题库 DS面经

道画师   2017-10-17 22:26

2

sklearn不支持查看系数的p-value,可以参考statsmodels模块。


SofaSofa数据科学社区DS面试题库 DS面经

Lydia   2017-10-17 09:37



  相关主题

sklearn回归的入门级问题   3回答

当训练集只有一个特征的时候,sklearn的LinearRegression报错   1回答

python sklearn模型中random_state参数的意义   2回答

求sklearn.pipeline.Pipeline使用的例子   1回答

sklearn训练classifier的时候报错Unknown label type   1回答

sklearn里learning_rate什么意思?   2回答

sklearn里的LabelEncoder什么用?   3回答

lightgbm.LGBMModel和lightgbm.LGBMClassifier该用哪个?   1回答

sklearn.linear_model.SGDClassifier中的参数n_iter设置问题   2回答

提取sklearn逻辑回归的模型系数   1回答

sklearn实现adaboost算法了吗?   1回答

sklearn的模型如何保存下来?   2回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!