怎么处理训练集中有而测试集中没有的那些特征?

  统计/机器学习 数据预处理 特征选择 开放问题    浏览次数:384        分享
0

大家好,我训练集中有10个特征,而测试集中只有其中8个特征,少了2个特征。这种情况我该怎么处理呢?谢谢!

 

zhaijing   2019-05-26 14:25



   3个回答 
2
那只能删除训练集多出的特征,训练集和测试集的特征需要一致才行。SofaSofa数据科学社区DS面试题库 DS面经

zlsama   2019-05-31 19:05

1

先說明你的特徵是什麼吧?

你是指分成10類的意思嗎?

SofaSofa数据科学社区DS面试题库 DS面经

paul09253336   2019-05-26 17:17

比如说训练集有十个特征x1,x2,x3,...,x10用来预测y;测试集里只有x1,x2,...,x8。那我怎么预测测试集中的y呢? - zhaijing   2019-05-27 11:25
0

要么删掉那些特征,要么把那些特征当作空缺值,然后填值。

SofaSofa数据科学社区DS面试题库 DS面经

ShenShiyi   2019-08-13 07:30



  相关主题

如何检测判断特征的多重共线性?   2回答

在进行数值编码时出现错误,怎么解决?   1回答

python中如何产生交互项?   2回答

训练样本中每个维度是否独立对回归结果的影响   2回答

对于组合特征怎么理解?   1回答

什么情况下需要做特征选择?   1回答

wrapper特征选择法是什么意思?   1回答

一个特征有两个可选的值,只需满足其中一个即可,该如何处理?   1回答

使用uci的社区犯罪率做回归,怎么选择因变量呢   2回答

在分类问题中,有什么方法可以得到特征的重要性?   2回答

partial dependence是什么意思?   1回答

%%timeit结果解释   1回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!