树模型有哪些假设?比如,对样本数据的分布有做假设吗?

  统计/机器学习 监督式学习    浏览次数:1763        分享
0

1. 在特征划分之后,有对 数据分布 做前置假设吗?

2. 样本空间被特征划分之后,那么实际生成的是样本数据与划分空间之间的关系,最终还是要落到标记,划分空间与标记之间的映射关系是如何判别的?

 

firewang   2021-03-04 17:57



   1个回答 
3

“1. 在特征划分之后,有对 数据分布 做前置假设吗?”

----------------------

树模型基本都是非参模型(也就是没有什么分布假设)。

正常的假设和其他监督学习差不多,就是包含训练集和预测集是同分布的,比如目标变量的分别是相对均衡的等等。


“2. 样本空间被特征划分之后,那么实际生成的是样本数据与划分空间之间的关系,最终还是要落到标记,划分空间与标记之间的映射关系是如何判别的?”

----------------------

训练好的决策树最终呈现出的结构实际上if-else组成的一个判断逻辑,从树根(顶部)往下一路判断下去就会到最终的叶节点(底部),每个叶节点也是对应的样本空间。这个叶节点里里正样本的占比,就是label为正的概率。

下图就是一个例子:


SofaSofa数据科学社区DS面试题库 DS面经

Arsjun   2022-04-24 20:30



  相关讨论

逻辑回归的前提假设是什么?

线性回归随机误差项不满足基本假设会怎样?

线性回归需要满足哪些基本前提假设

单因素方差分析(one-way anova)在使用时需要有什么前提假设条件吗?

假设检验中的p值是什么意思?为什么越小越好?

T检验需要提前假设吗?

假设检验的效力是什么?

怎么对两个样本的方差进行假设检验

怎么利用假设检验判断两个骰子是相同的?

线性回归因变量y不满足正态性假设

  随便看看

分类特征的目标编码是什么意思?

spark里怎么refresh表?

如何获取pyspark DataFrame的行数和列数?

模型调参时常用到的Grid Search是什么意思?

统计里的IQR是什么意思?