对sklearn的决策树进行剪枝

  统计/机器学习 监督式学习 Python    浏览次数:11153        分享
2

请教各位,可以对sklearn的决策树模型进行剪枝吗?

 

张球球   2017-10-13 09:37



   3个回答 
4

目前还没有。

不过。

在山的那边,海的那边,有一群勤劳的程序员,他们正在讨论在新版本的sklearn里增加post-prune。


链接在此

https://github.com/scikit-learn/scikit-learn/issues/6557

SofaSofa数据科学社区DS面试题库 DS面经

Lydia   2017-10-13 12:17

2

sklearn目前没有具体实现剪枝的功能。

现在能做的是预剪枝,就是设置Classifier或者Regression里的参数max_depth, min_samples_split, min_samples_leaf。

后剪枝的确是在sklearn中做不到的。


----------补充-----------

什么是预剪枝,后剪枝?

SofaSofa数据科学社区DS面试题库 DS面经

派大星   2017-10-13 10:14

2

当然有,这个是针对sklearn的决策树进行剪枝的完整代码和解析

https://blog.csdn.net/appleyuchi/article/details/83692381

SofaSofa数据科学社区DS面试题库 DS面经

appleyuchi   2019-07-11 11:35



  相关讨论

sklearn DecisionTreeRegressor模型中为什么会有随机种子random_state?

怎么得到sklearn里的RandomForestClassifier训练好之后每棵树的叶节点的个数?

sklearn随机森林设置每棵树的权重

sklearn里怎么获得adaboost中每棵树的权重?

怎么获得sklearn里决策树的实际深度?

sklearn里的RandomForestClassifier怎么选样本的数量

lightgbm.LGBMModel和lightgbm.LGBMClassifier该用哪个?

sklearn里的RandomForestClassifier和ExtraTreesClassifier有什么区别吗?

sklearn模块里的DecisionTreeClassifier为什么每次结果不同(数据相同的情况下)

可视化sklearn决策树的结构

  随便看看

为什么LASSO可以做特征选择,而Ridge却不行?

回归问题中R方可以小于0吗?

为啥Xgboost比GradientBoost好那么多?

医学统计里的c-index或者c-statistic是什么意思?

huber loss是什么?什么时候用?