Gradient Boosting Decision Tree排序问题-慕课网

1回答

提问者苏子浩 2019-05-16 23:56:21

老师，是因为建树的原因吗，在同一棵树中，这个节点的heigh越小(i.e. 越早被选为评判标准的节点)，对于整个树来说信息熵的增益越多，可以对数据集进行更好的划分。所以可以根据这个点被选作split node的个数，作为特征排序的一个方法吗？

0 回复有任何疑惑可以回复我~

收起回答

liuyubobobo #1

和你的理解差不多。不过通常认为，一个节点的height越小（越早被选为评判标准的节点），对于整个树来说信息熵的增益越多，可以对数据集进行更好的划分。所以就完全可以根据一个特征在决策树构造过程中选用的早晚，来决定特征的重要程度。当然，更加精细的，可以不仅考虑早晚，还考虑你说的多少，可以把重要程度作一个加权和。（选择的早晚是权重，越早权重越大）：）

回复有任何疑惑可以回复我~ 2019-05-17 01:57:53

提问者苏子浩回复 liuyubobobo #2
```
好呢，谢谢老师！
```
回复有任何疑惑可以回复我~ 2019-05-17 09:26:05

Gradient Boosting Decision Tree排序问题

正在回答回答被采纳积分+3

1回答

相似问题

请选择置顶位置

本课精华内容

PCA降维的把握和依据分别是什么？比如把一个近似直线分布的二维点数据降维成直线？

关于线性回归中归一化处理和不对归一化处理的问题

数据归一化为什么有用？对归一化无法直观理解

如何判断欠拟合是因为模型选择错误还是超参数选择错误？

学好具体算法和机器学习的实际应用之间有哪些距离？

关于 XGBoost

关于机器学习不同的指标

其他算法的决策边界

在三维数据上的 PCA

关于回归和分类

热搜

最近搜索清空