请稍等 ...
×

采纳答案成功!

向帮助你的同学说点啥吧!感谢那些助人为乐的人

关于stacking集成二层训练集维度的疑问

老师,请教一下关于两层的stacking集成的问题,假设一个关于二分类的问题,第一层有4个算法,如果我用的是一层模型预测的类概率作为二层模型的训练集,那二层的训练集的维度是不是4*2啊,如果一层模型预测的是类标签的话,那维度就是4.

正在回答 回答被采纳积分+3

1回答

liuyubobobo 2019-11-09 02:10:58

第二层训练集的维度是 4。 4 个 算法对每一个数据的预测概率值,成为了第二层的特征值:)


看一看这个问答,看看是否能理解?https://coding.imooc.com/learn/questiondetail/47635.html


加油!:)

0 回复 有任何疑惑可以回复我~
  • 提问者 海滩小贝壳 #1
    老师,我明白您的意思,我的意思是用predict和predict_proba这两个预测的结果作为二层模型的训练集的区别,predict只是预测一个样本属于具体哪一个类标签,结果是一维的,所以4个算法预测出4个类标签,二层训练集的特征维度就是4,而predict_proba不是返回二维的数组吗,分别表示样本属于0或1的概率,这样4个算法的预测结果不是8列吗?
    回复 有任何疑惑可以回复我~ 2019-11-09 14:55:04
  • liuyubobobo 回复 提问者 海滩小贝壳 #2
    我们只统一使用预测为 1 的概率(或者预测为 0 的改概率)就好了。因为预测为 0 的概率 + 预测为 1 的概率结果为 1,是固定的,所以,这两个特征是在反应同样的信息。预测为 0 的概率并没有比预测为 1 的概率提供更多新的信息。从数学的角度来讲,就是他们是线性相关的,没有额外的信息。只是用一个就够了:)
    回复 有任何疑惑可以回复我~ 2019-11-09 14:58:04
  • 提问者 海滩小贝壳 回复 liuyubobobo #3
    我明白了,谢谢老师的耐心解答
    回复 有任何疑惑可以回复我~ 2019-11-20 16:11:16
问题已解决,确定采纳
还有疑问,暂不采纳
意见反馈 帮助中心 APP下载
官方微信