采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
老师将数据集分成三份这样的做法主要问题是不是,验证数据集中可能会有极端数据,可能模型已经拟合好了,但是因为极端数据而误判,导致重新修改参数训练模型,所以之后改进的就是用交叉验证,采用多个测试的数据集
我不确定你说的“三份”是指什么?
如果是指 k-fold 的交叉验证,其中 k = 3,是的,这个目的是为了防止极端数据。
但如果是指分成训练-验证-测试数据集三部分,而不是训练-测试数据集两部分,这是为了防止我们每次都根据测试数据集的结果调参,最终调出的模型对测试数据集过拟合。
继续加油!:)
老师您之前一分多钟的时候还没有说交叉验证,说的是一个分成三份数据集,一份用来训练,一份用来验证,一份用来最后确定模型的测试数据,就我觉得从这种验证算法演变到交叉验证的原因是因为,验证数据集中可能有极端数据,会误导我们判断这个模型是否是合理的,所以有了交叉验证
对的,你的理解是正确的:)
谢谢老师!
登录后可查看更多问答,登录/注册
Python3+sklearn,兼顾原理、算法底层实现和框架使用。
2.6k 19
3.6k 17
3.1k 15
1.7k 15
1.6k 14
购课补贴联系客服咨询优惠详情
慕课网APP您的移动学习伙伴
扫描二维码关注慕课网微信公众号