statsmodels里的ols怎么处理分类变量?

  统计/机器学习 回归分析 数据预处理 Python    浏览次数:840        分享
0

statsmodels里的ols怎么处理分类变量?最好是能够像R里那样,直接处理的,不然的话就要像sklearn那样先one-hot了。多谢各位老铁!

 

luzehao   2018-09-07 14:27



   1个回答 
3

比如你有一个pandas的dataframe,叫做df,要预测列名是y,有两个特征,numerical特征x1和categorical特征x2,那么用下面的表达式就可以了,不需要做one-hot

import statsmodels.formula.api as smf
res = smf.ols(formula='y ~ x1 + C(x2)', data=df).fit()


SofaSofa数据科学社区DS面试题库 DS面经

蘑菇蘑菇   2018-09-07 22:14



  相关主题

对进行回归分析之前,如何处理不同类型的变量?   1回答

数据的标准化(Z-score标准化)是否会改变训练得到的超平面系数向量?   1回答

线性回归的变量归一化的问题   1回答

怎么把dataframe的一列转成整数类型   2回答

python中怎么把千位分隔符以及货币符号去掉转成数值形式?   1回答

让DataFrame中的行按照某一列元素的绝对值从大到小排列   1回答

怎么求一个数组的移动平均数   1回答

怎麼將dataframe 欄位 對應到原有的csv檔 而寫入   1回答

拟合数据的Z-score规范化怎么进行操作?   2回答

python里怎么做分位数回归(quantile regression)?   1回答

系数非负的线性回归的python实现   2回答

什么时候需要对y或者特征进行对数变换?   1回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!