离散变量和连续变量可以一起放入机器学习的分类器中吗?

  统计/机器学习 监督式学习 数据预处理    浏览次数:1267        分享
0

离散变量和连续变量可以一起放入机器学习的分类器中吗?还是要做什么处理呢?

 

yaya   2019-05-08 16:56



   1个回答 
0

有些模型可以,有些模型不可以。

但是通常我们会把离散变量处理一下,比如one-hot coding,然后再进行分类。此外,在Python sklearn里,我们需要把离散变量都变成数值变量才能训练。

R里面有的package可以接受同时有离散变量和连续变量。

SofaSofa数据科学社区DS面试题库 DS面经

wxw_pku   2019-05-09 12:01



  相关主题

数据一样,y却不一样的样本该怎么处理?   2回答

对于数值型变量模型怎么知道是连续变量还是离散变量?   2回答

对连续特征一定要进行分箱处理吗?   3回答

z-score标准化不适用于处理什么样的数据?   1回答

在数据预处理阶段,特征的标准化有哪些方法?   1回答

dummy variable是n个还是n-1个   3回答

在训练前数据处理的时候,怎么剔除异常值?   2回答

什么时候需要对y或者特征进行对数变换?   1回答

怎么对特征做标准化使得数值都是正数?   3回答

为什么说非平衡(倾斜)的数据不好?   2回答

训练集中重复的样本需要被删除吗?   3回答

数据的标准化(Z-score标准化)是否会改变训练得到的超平面系数向量?   1回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!