采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
老师上面是Gini系数的计算公式,下面是您写的代码
我觉得有点问题,代码应该只需要这样就够了吧
1-sum([getProbss(d[k]) for k in d])
同学你好,gini系数计算的时候,是需要考虑样本数量加权的。原始公式没标出来是不考虑样本数量加权的结果,训练模型时是需要考虑的。
登录后可查看更多问答,登录/注册
快速胜任数据分析岗位,逆袭成为数据掘金时代的抢手人才!
1.2k 18
985 13
890 10
824 10
1.0k 9