请稍等 ...
×

采纳答案成功!

向帮助你的同学说点啥吧!感谢那些助人为乐的人

老师,请问v的取值为什么是两个相邻X的平均值?取不同权重也没有影响,还是决策树的划分里取的就是平均呢?

正在回答 回答被采纳积分+3

2回答

提问者 慕妹1247651 2020-10-18 18:48:10

谢谢老师,不用抱歉,我看到上一章您的解释了。但我自己的问题是问这句代码: v = (X[sorted_index[i], d] + X[sorted_index[i-1], d])/2   。就是这里切分点的选择为啥是俩观测的平均值呢?sklearn包里也是按照观测均值来切分的吗?而不是按照一个连续数值循环来算的?

0 回复 有任何疑惑可以回复我~
  • 这里 v 划分在 X[sorted_index[i], d] 和 X[sorted_index[i-1], d] 之间的什么位置,完全不影响整棵决策树的分类。因为这里只是尝试把 X[sorted_index[i], d] 和 X[sorted_index[i-1], d] 分开而已,具体在哪里分开,在我们的测试数据中,已经没有差别了。可以试试看,把这个切分的位置变换一下,比如:v = X[sorted_index[i], d] / 3 + X[sorted_index[i-1], d] * 2 / 3 (在两者的 1/3 点处切分),你会看到,整个计算结果,除了切分位置的变换(v 的变换),其他都一样:)
    回复 有任何疑惑可以回复我~ 2020-10-19 00:00:51
  • 提问者 慕妹1247651 回复 liuyubobobo #2
    十分感谢老师的解答。
    回复 有任何疑惑可以回复我~ 2020-10-31 12:36:05
liuyubobobo 2020-10-17 20:21:03

这里课程有误,应该使用加权平均,而非算术平均。可以参考这里:http://coding.imooc.com/learn/questiondetail/68117.html


抱歉!


继续加油!:)

0 回复 有任何疑惑可以回复我~
问题已解决,确定采纳
还有疑问,暂不采纳
意见反馈 帮助中心 APP下载
官方微信