怎么理解决策树是模型自己在做interaction?

  统计/机器学习 监督式学习 特征选择    浏览次数: 290
1

线性模型需要人工做interaction,添加相应的变量,但是对于决策树来说,它可以自己做interaction

请问怎么理解决策树是模型自己在做interaction?

谢谢!


相关问题:既然xgboost那么好,线性回归还有存在的价值吗?


 

dsjobhunter   2018-03-08 14:11



   1个回答 
3

我说说我的理解,如果不对请轻拍。

就拿binary feature举例吧。

比如你回归预测码农们的工资,一个变量是性别$X_1$,0代表男,1代表女,一个变量是学历$X_2$,0代表本科,1代表研究生。

如果没有interaction term(交互项、交叉项等等翻译),线性模型就是$$y=\beta_0+\beta_1X_1+\beta_2X_2$$

如果是决策树,会生成两个子树,一个子树对于男生做预测、一个子树对于女生做预测。$S_1$就代表是男生并且本科学历,而$S_2$就代表是男生并且研究生学历。这就相当于起到了interaction的作用。



岛歌   2018-03-09 12:16

谢谢回答 - dsjobhunter   2018-03-30 14:05


  相关主题

随机森林给出的变量的Importantce是怎么来的   1回答

随机森林每次用多少个特征?   2回答

对于树模型,需不需要特征筛选   1回答

对于数值特征,决策树是如何决定阈值的?   3回答

gbdt如何对连续特征离散化   1回答

在分类问题中,有什么方法可以得到特征的重要性?   2回答

回归树是以什么标准来选特征的?   1回答

对于组合特征怎么理解?   1回答

一个特征有两个可选的值,只需满足其中一个即可,该如何处理?   1回答

AIC可以是负数吗?   1回答

python使用MFCC特征训练GMMHMM模型   2回答

关于K均值聚类的权重问题   2回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!