我有4个变量:
变量1:是取值0到1之间的实数
变量2:是取值0到100000之间的数
变量3:是categorical variable,有6个不同的取值
变量4:也是categorical variable,有3个不同取值,但是它们之间是有排序关系,类似于“微弱”,“中等”,“强烈”
在回归之前我需要对这些变量做哪些处理呢?
1个回答
可以先对变量1,2进行标准化(常见标准化方法)
变量3是分类变量,六个不同取值,所以需要编码成5列变量
变量4其实就是1,2,3整数变量,可以采用对变量1,2一样的方法进行标准化。
相关主题
特征归一化后的多项式回归拟合结果
2回答
虚拟变量能否标准化?
2回答
数据的标准化(Z-score标准化)是否会改变训练得到的超平面系数向量?
1回答
线性回归的变量归一化的问题
1回答
泊松回归的公式是什么?
2回答
最小二乘线性回归的推导
2回答
怎么处理真值大部分为0的回归问题
3回答
门槛回归是什么?
1回答
我们谢绝在回答前讲“生动”的故事。
我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。
我们谢绝答非所问。
我们谢绝自己不会、硬要回答。
我们感激每一个用户在编写答案时的努力与付出!