对于组合特征怎么理解?

  统计/机器学习 特征选择    浏览次数: 328
1

众所周知,传统机器学习的主要工作在于特征工程,其中特征工程中进行特征组合往往会对模型的结果带来提升。

举个例子,考虑第一个特征“性别”,男为1,女为0;第二个特征“是否喜欢宠物”,喜欢宠物为1,不喜欢宠物为0。那么组合后构造了“性别_是否喜欢宠物”这个新的维度的特征,这个特征的取值可以是00、01、10、11。

组合特征背后的理论基础是什么呢?怎么更好地去理解组合特征?之前有看到过组合特征可以发现特征与特征之间的关系,从而发现非线性关系,不太理解,谢谢!

 

dzzxjl   2018-04-04 21:00



   1个回答 
0

你说的这个“特征组合”实际上就是interaction term.

interaction在统计和计量经济里是个成熟的话题了,可以参考Wikipedia: Interaction


Nagozi   2018-04-05 04:45



  相关主题

一个特征有两个可选的值,只需满足其中一个即可,该如何处理?   1回答

在分类问题中,有什么方法可以得到特征的重要性?   2回答

AIC可以是负数吗?   1回答

关于K均值聚类的权重问题   2回答

python使用MFCC特征训练GMMHMM模型   2回答

对于树模型,需不需要特征筛选   1回答

怎么理解决策树是模型自己在做interaction?   1回答

对于数值特征,决策树是如何决定阈值的?   3回答

随机森林每次用多少个特征?   2回答

随机森林给出的变量的Importantce是怎么来的   1回答

gbdt如何对连续特征离散化   1回答

回归树是以什么标准来选特征的?   1回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!