关于stacking集成二层训练集维度的疑问-慕课网

1回答

liuyubobobo 2019-11-09 02:10:58

第二层训练集的维度是 4。 4 个算法对每一个数据的预测概率值，成为了第二层的特征值：）

看一看这个问答，看看是否能理解？https://coding.imooc.com/learn/questiondetail/47635.html

加油！：）

0 回复有任何疑惑可以回复我~

收起回答

提问者海滩小贝壳 #1

老师，我明白您的意思，我的意思是用predict和predict_proba这两个预测的结果作为二层模型的训练集的区别，predict只是预测一个样本属于具体哪一个类标签，结果是一维的，所以4个算法预测出4个类标签，二层训练集的特征维度就是4，而predict_proba不是返回二维的数组吗，分别表示样本属于0或1的概率，这样4个算法的预测结果不是8列吗？

回复有任何疑惑可以回复我~ 2019-11-09 14:55:04

liuyubobobo 回复提问者海滩小贝壳 #2

我们只统一使用预测为 1 的概率（或者预测为 0 的改概率）就好了。因为预测为 0 的概率 + 预测为 1 的概率结果为 1，是固定的，所以，这两个特征是在反应同样的信息。预测为 0 的概率并没有比预测为 1 的概率提供更多新的信息。从数学的角度来讲，就是他们是线性相关的，没有额外的信息。只是用一个就够了：）

回复有任何疑惑可以回复我~ 2019-11-09 14:58:04

提问者海滩小贝壳回复 liuyubobobo #3
```
我明白了，谢谢老师的耐心解答
```
回复有任何疑惑可以回复我~ 2019-11-20 16:11:16

关于stacking集成二层训练集维度的疑问

正在回答回答被采纳积分+3

1回答

相似问题

请选择置顶位置

本课精华内容

PCA降维的把握和依据分别是什么？比如把一个近似直线分布的二维点数据降维成直线？

关于线性回归中归一化处理和不对归一化处理的问题

数据归一化为什么有用？对归一化无法直观理解

如何判断欠拟合是因为模型选择错误还是超参数选择错误？

学好具体算法和机器学习的实际应用之间有哪些距离？

关于 XGBoost

关于机器学习不同的指标

其他算法的决策边界

在三维数据上的 PCA

关于回归和分类

热搜

最近搜索清空