回归树是以什么标准来选特征的?

  统计/机器学习 回归分析 监督式学习 特征选择 损失函数    浏览次数:4107        分享
2

对于决策树(分类问题),我们可以用熵或者增益率来选特征。那么对于回归树(回归问题),我们用什么标准来选择特征呢?



 

MrMath   2017-06-13 13:19



   1个回答 
5

根据自己定义的loss function来选特征,可以是RMSE,也可以MAE。

哪个特征能最大程度的降低这棵树的loss,就选哪个特征。这个是和普通的分类决策树一个道理。


SofaSofa数据科学社区DS面试题库 DS面经

batmanX   2017-06-14 10:04



  相关讨论

如何理解GBDT里面“损失函数的负梯度在当前模型的值,可以作为残差的估计”?

GBDT的损失函数为绝对值时,每棵树去拟合梯度吗?还是仍拟合残差?

GBDT做分类时,算出残差结果以后,以什么作为损失函数去判断在哪里分叉?

GBDT做回归时,如果设定树的深度为2,那树的第一层是用残差计算方差还是用原来的Y计算方差?

对于树模型,需不需要特征筛选

GBDT的数据在使用前有什么需要注意的吗?

对于数值特征,决策树是如何决定阈值的?

怎么理解决策树是模型自己在做interaction?

随机森林每次用多少个特征?

随机森林给出的变量的Importance是怎么来的

  随便看看

怎么在已有的dataframe中插入一个新列(Pandas)

plt.scatter plot怎么让不同的类别有不同的颜色

为什么图的拉普拉斯矩阵的最小特征值一定是0?

sklearn训练classifier的时候报错Unknown label type

凸函数、凸集分别是什么意思?