请稍等 ...

请问scikitlearn的决策树是如何剪枝的呢

老师你好，我看到很多地方提到预剪枝和后剪枝。请问这个和您课程中讲的调节超参数有什么关系呢。scikit-learn是预剪枝还是后剪枝呢?谢谢

宝慕林4453330 2020-07-14 14:01:22

源自：12-5 CART与决策树中的超参数

1032

收起

提交取消

1回答

liuyubobobo 2020-07-14 18:18:55

scikit-learn 默认创建一棵决策树，不使用剪枝策略。但是 scikit-learn 中的最新版本的决策树已经支持了剪枝，使用的是后剪枝。具体靠 ccp_alpha 来调节。ccp 就是 cost complexity pruning 的简称。

关于 ccp_alpha 这个参数的定义，可以参考 sklearn DecisionTree 官方文档最后一个参数：https://scikit-learn.org/stable/modules/generated/sklearn.tree.DecisionTreeClassifier.html#sklearn.tree.DecisionTreeClassifier

因为是 0.22 才加如的新特性，录这个课程还没有呢，这个课程对这个参数也没有介绍。简单来说，就是数值越大，剪枝越狠。默认为 0.0，表示不剪枝。

关于这个参数的实验，sklearn 的官方文档给出了一个非常好的例子，帮助大家理解这个参数，可以参考这里：https://scikit-learn.org/stable/auto_examples/tree/plot_cost_complexity_pruning.html#sphx-glr-auto-examples-tree-plot-cost-complexity-pruning-py

加油！：）

0 回复有任何疑惑可以回复我~

提问者宝慕林4453330 #1

老师，我看了一下文档中的案例，大概明白了ccp_alpha与模型的总不纯度成正比，与树的深度成反比，模型调优应该是找到合适的ccp_alpha，来平衡模型不纯度与模型的复杂度。但是不太明白ccp_alpha的物理意义是什么，老师能否解答一下？非常感谢

回复有任何疑惑可以回复我~ 2020-07-16 17:23:00

相似问题

决策树的应用场景

是不是在sklearn中对于剪枝都是这种方式？

请问老师，结合上节课的投票角度，为什么在soft中只选用决策树一种算法进行训练得到子模型，而不是采用多种算法也训练多个子模型呢？

关于决策树 bagging 与随机森林的疑问

关于LeetCode78题的剪枝问题

登录后可查看更多问答，登录/注册

Python3入门机器学习经典算法与应用

参与学习 5893 人
提交作业 275 份
解答问题 2454 个

Python3+sklearn，兼顾原理、算法底层实现和框架使用。

了解课程

本课精华内容

问答作业

PCA降维的把握和依据分别是什么？比如把一个近似直线分布的二维点数据降维成直线？

2.7k 19

关于线性回归中归一化处理和不对归一化处理的问题

3.7k 17

数据归一化为什么有用？对归一化无法直观理解

3.1k 15

如何判断欠拟合是因为模型选择错误还是超参数选择错误？

1.7k 15

学好具体算法和机器学习的实际应用之间有哪些距离？

1.6k 14

查看更多本课问答

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

扫描二维码
关注慕课网微信公众号