statsmodels里的ols怎么处理分类变量?最好是能够像R里那样,直接处理的,不然的话就要像sklearn那样先one-hot了。多谢各位老铁!
1个回答
比如你有一个pandas的dataframe,叫做df,要预测列名是y,有两个特征,numerical特征x1和categorical特征x2,那么用下面的表达式就可以了,不需要做one-hot
import statsmodels.formula.api as smf
res = smf.ols(formula='y ~ x1 + C(x2)', data=df).fit()
相关主题
虚拟变量能否标准化?
2回答
特征归一化后的多项式回归拟合结果
2回答
线性回归的变量归一化的问题
1回答
数据的标准化(Z-score标准化)是否会改变训练得到的超平面系数向量?
1回答
python里怎么做分位数回归(quantile regression)?
1回答
用uci的crimes做了一个线性回归,test很差
2回答
怎么求一个数组的移动平均数
1回答
python 读json 错误 ValueError: Unexpected character found when decoding array value (2)
0回答
我们谢绝在回答前讲“生动”的故事。
我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。
我们谢绝答非所问。
我们谢绝自己不会、硬要回答。
我们感激每一个用户在编写答案时的努力与付出!