关于 Adaboost 与 GBDT 加权操作疑问-慕课网

1回答

liuyubobobo 回答被采纳获得+3积分 2021-01-19 19:04:06

1. 重复3步骤后，遇到什么情况会停止？

具体做多少个分类器去 boost 之前的结果，是 boost 类型算法的一个超参数。你可以想象，如果 n 非常大，结果会大概率的过拟合你的数据；但如果 n 非常小，结果会欠拟合。你需要根据自己所处理的问题和数据，找到合适的 n

2.加权投票是什么意思，怎么加权？（分类准确率高的学习器权重增大？）

课程中对 adaboost 的原理介绍确实不深入。

整体来讲，adaboost 训练了 n 个分类器，这 n 个分类器的区别，是面对的训练数据的权值不同。最终在预测的时候，这 n 个分类器做投票。

是的，分类准确高越高，权值越大。权值的计算方式为：

其中，a(j) 是第 j 个分类器的权值；r(j) 为第 j 个分类器的错误率。你可以想象，错误率越高，分子越小，分母越大，整体 a(j) 越小，即权值越低。

式子中的 miu 是一个超参数。作为 adaboost 算法的一个超参数。

3. 下图看起来是分类问题，如果解决回归问题，还能加权投票的？具体是如何来预测相应的回归数值的？

可以，就是不同分类器得到的预测值的加权平均。（回忆一下课程中介绍的 knn 是怎么解决回归问题的？）

4. 整个GDBT算法逻辑，感觉与boosting 初始样本权重一致，后续增大错误样本权重，减小准确样本权重的步骤不太一致，是否boosting 单指 adaboost？

gradient boosting 算法属于 boost 类算法。adaboost 和 gradient boosting，都属于 boosting 类算法。

gradient boosting 并没有改变每一个样本的权重，这是和 adaboost 不一样的地方。gradient boosting 每次只是根据上一次预测的误差值再做一个分类器，尝试预测误差。

可以参考这里的讨论：http://coding.imooc.com/learn/questiondetail/171996.html

另外，gradient boosting 没有投票的过程。

5. GDBT 解决回归问题，我是很好理解的。但解决分类问题，我是比较难以想象的。他采取的方式，是否借鉴逻辑回归？这里的分类问题，是否有加权操作，如何加权操作？

是的，使用和逻辑回归相同的方式。也就是一个分类器，虽然把一个数据分类成为 a，但是 51% 的概率分类为 a，和 88% 的概率分类为 a，是不一样的。而如果我们知道一个样本实际对应的类别是 a，那最佳情况应该是 100% 为 a，所以这里是有误差的。gradient boosting 针对这个误差做调整。

继续加油！：）

3 回复有任何疑惑可以回复我~

收起回答

提问者 lemonlxn #1
```
赞，两者区别还是蛮明显的，待我再次整理下
```
回复有任何疑惑可以回复我~ 2021-01-19 19:32:49

关于 Adaboost 与 GBDT 加权操作疑问

adaboost

GDBT

正在回答

1回答

相似问题

请选择置顶位置

本课精华内容

PCA降维的把握和依据分别是什么？比如把一个近似直线分布的二维点数据降维成直线？

关于线性回归中归一化处理和不对归一化处理的问题

数据归一化为什么有用？对归一化无法直观理解

如何判断欠拟合是因为模型选择错误还是超参数选择错误？

学好具体算法和机器学习的实际应用之间有哪些距离？

关于 XGBoost

关于机器学习不同的指标

其他算法的决策边界

在三维数据上的 PCA

关于回归和分类

热搜

最近搜索清空