模型过拟合验证数据集-慕课网

1回答

liuyubobobo 2021-09-17 00:01:17

我不确定你说的“三份”是指什么？

如果是指 k-fold 的交叉验证，其中 k = 3，是的，这个目的是为了防止极端数据。

但如果是指分成训练-验证-测试数据集三部分，而不是训练-测试数据集两部分，这是为了防止我们每次都根据测试数据集的结果调参，最终调出的模型对测试数据集过拟合。

继续加油！：）

0 回复有任何疑惑可以回复我~

提问者 weixin_慕村8280326 #1

老师您之前一分多钟的时候还没有说交叉验证，说的是一个分成三份数据集，一份用来训练，一份用来验证，一份用来最后确定模型的测试数据，就我觉得从这种验证算法演变到交叉验证的原因是因为，验证数据集中可能有极端数据，会误导我们判断这个模型是否是合理的，所以有了交叉验证

回复有任何疑惑可以回复我~ 2021-09-17 00:04:17

liuyubobobo 回复提问者 weixin_慕村8280326 #2
```
对的，你的理解是正确的：）
```
回复有任何疑惑可以回复我~ 2021-09-17 00:10:05
提问者 weixin_慕村8280326 回复 liuyubobobo #3
```
谢谢老师！
```
回复有任何疑惑可以回复我~ 2021-09-17 00:10:40

模型过拟合验证数据集