决策树是如何得到量化的概率,不只是0或1的标签?

  统计/机器学习 监督式学习    浏览次数:1762        分享
4

决策树是如何得到量化的概率,不只是0或1的标签?


 

CatalanFubini   2017-12-04 13:05



   2个回答 
8

举个例子好了,你要判断今天有没有下过雨。你观测了过去32天的两项特征:一、能不能看到太阳,二、地上有没有水。于是你就把这32天的数据做成了如下的决策树。

假如今天能看得到太阳,那么根据上面的决策树,今天下雨的概率为1/(1+9)=0.1

假如今天不能看到太阳,但是地上有水,那么预测今天下过雨的概率为18/(18+2)=0.9

假如今天不能看到太阳,地上也没有水,那么预测今天下过雨的概率为0/(0+2)=0.0

所以决策树预测出来的概率就是对应子节点里下雨天的比率。


SofaSofa数据科学社区DS面试题库 DS面经

sasa   2017-12-09 14:05

谢谢!你的图解释得清楚。乍一看,“天上有没有太阳”有点奇怪,意思应该是“能不能看到太阳”吧 - CatalanFubini   2017-12-15 16:06
2

其实预测出的分类也是根据数值概率来的。

比如一个叶节点里有3个阳性样本,2个阴性样本,那么这个叶节点预测出来的概率就是0.6。因为0.6 > 0.5,所以预测出来的标签是阳性。


SofaSofa数据科学社区DS面试题库 DS面经

wlk1993   2017-12-05 15:25



  相关主题

决策树怎么做增量学习或者online学习?   1回答

剪枝是什么意思   1回答

python里实现一个简单的决策树   1回答

Extra Tree算法   1回答

gbdt为什么需要泰勒公式展开进行节点分裂计算   2回答

随机森林是如何计算测试样本的概率的?   1回答

如果采用非等权重的方法集成一个随机森林,会表现得更好嘛?   1回答

随机森林的模型一般都很大么?   1回答

Adaboost里的树有没有可能权重是负数?   1回答

决策树可以做多元分类吗?   1回答

决策树算法ID3,C4.5和CART的特点、异同?   3回答

决策树、随机森林中的多重共线性问题   3回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!