请稍等 ...

决策树解决回归问题的原理

bobo老师，决策树在解决分类问题时，通过遍历dim和value找到分裂的两组数据的最优信息熵值，信息熵是根据各个类别的比例计算出来的；但是如果是回归问题，每个样本的y值是个连续的数值，这个怎么计算信息熵呢，如何去确定那个最优的分裂呢

小红果的爸爸 2019-08-02 23:09:41

源自：12-6 决策树解决回归问题

1374

收起

提交取消

2回答

liuyubobobo 2019-08-03 02:06:08

也有很多标准。原始的决策树论文的标准，也是最经典的标准，是最小化SSE(sum of squares error)

式子是这样的：

//img1.sycdn.imooc.com//szimg/5d447b2e097565f005180075.jpg

其实很好理解，就是划分成两部分以后，这两部分的的误差平方和（每个结果减均值的平方）最小。

继续加油！：）

0 回复有任何疑惑可以回复我~

收起回答

慕圣6380070禅达 2020-03-03 20:33:06

对于回归树，衡量分类标准的是样本方差，分裂方法与回归树类似，只是把熵函数改成方差函数

E(D) = sum(y.hat - y.average)**2 / m

0 回复有任何疑惑可以回复我~

收起回答

相似问题

决策树能否解决多项式回归问题

决策树的应用场景

请问老师，结合上节课的投票角度，为什么在soft中只选用决策树一种算法进行训练得到子模型，而不是采用多种算法也训练多个子模型呢？

决策树与SVM关联性问题

关于决策树的决策边界

登录后可查看更多问答，登录/注册

Python3入门机器学习经典算法与应用

参与学习 5852 人
提交作业 275 份
解答问题 2437 个

Python3+sklearn，兼顾原理、算法底层实现和框架使用。

了解课程

本课精华内容

问答作业

PCA降维的把握和依据分别是什么？比如把一个近似直线分布的二维点数据降维成直线？

2.5k 19

关于线性回归中归一化处理和不对归一化处理的问题

3.5k 17

数据归一化为什么有用？对归一化无法直观理解

3.0k 15

如何判断欠拟合是因为模型选择错误还是超参数选择错误？

1.6k 15

学好具体算法和机器学习的实际应用之间有哪些距离？

1.5k 14

查看更多本课问答

意见反馈帮助中心 APP下载

官方微信

决策树解决回归问题的原理

正在回答

2回答

相似问题