请稍等 ...
×

采纳答案成功!

向帮助你的同学说点啥吧!感谢那些助人为乐的人

模型过拟合验证数据集

老师将数据集分成三份这样的做法主要问题是不是,验证数据集中可能会有极端数据,可能模型已经拟合好了,但是因为极端数据而误判,导致重新修改参数训练模型,所以之后改进的就是用交叉验证,采用多个测试的数据集

正在回答 回答被采纳积分+3

1回答

liuyubobobo 2021-09-17 00:01:17

我不确定你说的“三份”是指什么?


如果是指 k-fold 的交叉验证,其中 k = 3,是的,这个目的是为了防止极端数据。

但如果是指分成训练-验证-测试数据集三部分,而不是训练-测试数据集两部分,这是为了防止我们每次都根据测试数据集的结果调参,最终调出的模型对测试数据集过拟合。


继续加油!:)

0 回复 有任何疑惑可以回复我~
  • 提问者 weixin_慕村8280326 #1
    老师您之前一分多钟的时候还没有说交叉验证,说的是一个分成三份数据集,一份用来训练,一份用来验证,一份用来最后确定模型的测试数据,就我觉得从这种验证算法演变到交叉验证的原因是因为,验证数据集中可能有极端数据,会误导我们判断这个模型是否是合理的,所以有了交叉验证
    回复 有任何疑惑可以回复我~ 2021-09-17 00:04:17
  • liuyubobobo 回复 提问者 weixin_慕村8280326 #2
    对的,你的理解是正确的:)
    回复 有任何疑惑可以回复我~ 2021-09-17 00:10:05
  • 提问者 weixin_慕村8280326 回复 liuyubobobo #3
    谢谢老师!
    回复 有任何疑惑可以回复我~ 2021-09-17 00:10:40
问题已解决,确定采纳
还有疑问,暂不采纳
意见反馈 帮助中心 APP下载
官方微信