怎么处理训练集中有而测试集中没有的那些特征?

  统计/机器学习 数据预处理 特征选择 开放问题    浏览次数:5308        分享
1

大家好,我训练集中有10个特征,而测试集中只有其中8个特征,少了2个特征。这种情况我该怎么处理呢?谢谢!

 

zhaijing   2019-05-26 14:25



   4个回答 
2
那只能删除训练集多出的特征,训练集和测试集的特征需要一致才行。SofaSofa数据科学社区DS面试题库 DS面经

zlsama   2019-05-31 19:05

1

先說明你的特徵是什麼吧?

你是指分成10類的意思嗎?

SofaSofa数据科学社区DS面试题库 DS面经

paul09253336   2019-05-26 17:17

比如说训练集有十个特征x1,x2,x3,...,x10用来预测y;测试集里只有x1,x2,...,x8。那我怎么预测测试集中的y呢? - zhaijing   2019-05-27 11:25
0

要么删掉那些特征,要么把那些特征当作空缺值,然后填值。

SofaSofa数据科学社区DS面试题库 DS面经

ShenShiyi   2019-08-13 07:30

0

把这些feature从training里面拿掉

SofaSofa数据科学社区DS面试题库 DS面经

Proton   2019-08-21 01:47



  相关讨论

类别型变量如何分箱

如何检测判断特征的多重共线性?

在进行数值编码时出现错误,怎么解决?

如果一列特征有90%以上的数值都是0,这个特征还有用吗?

两个特征整体的permutation importance

python中如何产生交互项?

训练样本中每个维度是否独立对回归结果的影响

通过SVD分解已经可以得到AX=Y解的稳定性的度量为什么还需要定义条件数来说明?

一个post网页爬取问题(爬取城市数据)

wrapper特征选择法是什么意思?

  随便看看

sklearn中的predict_proba方法的返回值的意义

为什么图的拉普拉斯矩阵的最小特征值一定是0?

如何复制一个pandas DataFrame

spark里怎么refresh表?

kNN算法有哪些缺点?