数学计算得到的矛盾-慕课网

2回答

liuyubobobo 回答被采纳获得+3积分 2020-12-13 05:18:00

截图里：一个模型给出的概率值，具体是指什么概率值？

如果我没有理解错，这里是指来一个数据点，是 0 的概率（或者是 1 的概率）。那这个概率值就是不变的，和我们是用什么方法预测无关。一个数据点到底是怎样的，和我们怎样预测它无关。

soft voting 保证的是预测的准确率提高。

继续加油！：）

0 回复有任何疑惑可以回复我~

收起回答

提问者 MrZLeo #1

小f是子模型预测的概率值，应该是介于0-1之间的一个值，大F是经过voting得到的整体模型的预测值，他应该也是介于0-1的。

根据这样计算的话，看起来大F的期望和小f的期望是一样的呀。

当然，计算方差的话就不一样了。但是方差影响的是模型的泛化能力，不直接影响偏差吧。

跟课程里面的实际计算比较起来，这就很迷惑。

但是课程里面假设的是各子模型完全独立，而这里，是从整体数据集里面随机抽样，所以可以假设他们个子模型的期望是相等的。是不是能从这个角度出发来解释呢？

感觉越想越迷糊了?

回复有任何疑惑可以回复我~ 2020-12-13 11:26:18

提问者 MrZLeo #2

小f是预测的概率值我觉得可以简单地从逻辑回归的输出值这样来理解吧。

回复有任何疑惑可以回复我~ 2020-12-13 11:27:22

提问者 MrZLeo #3

我参考是这个回答的Bagging部分的数学推导。
https://www.zhihu.com/answer/111637662

回复有任何疑惑可以回复我~ 2020-12-13 14:37:27

点开查看后面1条评论

liuyubobobo 2020-12-13 12:00:39

另外，权重也不是赋予的，不是每一个模型有一个权重，而是在统计结果的时候，我们考虑 fi 具体是多少，而不是 fi > 0.5 就选择一个。

请再仔细理解这个例子，我们没有一个权重和模型预测的结果相乘：

0 回复有任何疑惑可以回复我~

收起回答

数学计算得到的矛盾

正在回答

2回答

相似问题

请选择置顶位置

本课精华内容

PCA降维的把握和依据分别是什么？比如把一个近似直线分布的二维点数据降维成直线？

关于线性回归中归一化处理和不对归一化处理的问题

数据归一化为什么有用？对归一化无法直观理解

如何判断欠拟合是因为模型选择错误还是超参数选择错误？

学好具体算法和机器学习的实际应用之间有哪些距离？

关于 XGBoost

关于机器学习不同的指标

其他算法的决策边界

在三维数据上的 PCA

关于回归和分类

热搜

最近搜索清空