对进行回归分析之前,如何处理不同类型的变量?

  统计/机器学习 回归分析 数据预处理    浏览次数:4071        分享
0

我有4个变量:

变量1:是取值0到1之间的实数

变量2:是取值0到100000之间的数

变量3:是categorical variable,有6个不同的取值

变量4:也是categorical variable,有3个不同取值,但是它们之间是有排序关系,类似于“微弱”,“中等”,“强烈”


在回归之前我需要对这些变量做哪些处理呢?

 

魏哲   2017-04-17 10:31



   1个回答 
0

可以先对变量1,2进行标准化(常见标准化方法

变量3是分类变量,六个不同取值,所以需要编码成5列变量

变量4其实就是1,2,3整数变量,可以采用对变量1,2一样的方法进行标准化。


SofaSofa数据科学社区DS面试题库 DS面经

雷猴   2017-04-18 08:41



  相关主题

特征归一化后的多项式回归拟合结果   2回答

虚拟变量能否标准化?   2回答

statsmodels里的ols怎么处理分类变量?   1回答

线性回归的变量归一化的问题   1回答

数据的标准化(Z-score标准化)是否会改变训练得到的超平面系数向量?   1回答

拟合数据的Z-score规范化怎么进行操作?   2回答

特征是否也需要Box Cox变换?   1回答

在线性回归模型中存在epoch的说法吗?   2回答

门槛回归是什么?   1回答

最小二乘线性回归的推导   2回答

如果迫使一个线性回归模型的截距为0,会有什么坏处吗?   2回答

怎么处理真值大部分为0的回归问题   3回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!