决策树是如何得到量化的概率,不只是0或1的标签?

  统计/机器学习 监督式学习
0

决策树是如何得到量化的概率,不只是0或1的标签?


 

CatalanFubini   2017-12-04 13:05



   2个回答 
2

举个例子好了,你要判断今天有没有下过雨。你观测了过去32天的两项特征:一、能不能看到太阳,二、地上有没有水。于是你就把这32天的数据做成了如下的决策树。

假如今天能看得到太阳,那么根据上面的决策树,今天下雨的概率为1/(1+9)=0.1

假如今天不能看到太阳,但是地上有水,那么预测今天下过雨的概率为18/(18+2)=0.9

假如今天不能看到太阳,地上也没有水,那么预测今天下过雨的概率为0/(0+2)=0.0

所以决策树预测出来的概率就是对应子节点里下雨天的比率。


sasa   2017-12-09 14:05

1

其实预测出的分类也是根据数值概率来的。

比如一个叶节点里有3个阳性样本,2个阴性样本,那么这个叶节点预测出来的概率就是0.6。因为0.6 > 0.5,所以预测出来的标签是阳性。


wlk1993   2017-12-05 15:25



相关问题

决策树的熵是什么?怎么用熵来选分叉?   1回答

决策树算法ID3,C4.5和CART的特点、异同?   2回答

Gradient tree boosting和random forest (随机森林) 有什么区别和联系   1回答

Extra Tree算法   1回答

随机森林(random forest)和支持向量机(SVM)各有什么优劣   1回答

剪枝是什么意思   1回答

决策树可以做多元分类吗?   1回答

决策树剪枝有什么策略或者注意事项?   0回答

python sklean中的决策树是用的哪一种决策树算法?   1回答

python里实现一个简单的决策树   1回答

随机森林如何调参?   3回答

sklearn模块里的DecisionTreeClassifier为什么每次结果不同(数据相同的情况下)   1回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!