老师 8-6 6:59 处没有太理解极端数据时什么意思？-慕课网

2回答

ianzhang 2018-03-06 22:11:43

我的理解，验证数据是应该用于给模型调参，如果验证数据中的存在极端数据会造成模型过拟合。测试数据只用于模型最终打分情况，作为衡量模型好坏的一个标准，不参与模型调参，对模型没有修正作用。

2 回复有任何疑惑可以回复我~

收起回答

提问者神经旷野舞者 #1
```
还有模型打分这个说法？以前没听过
```
回复有任何疑惑可以回复我~ 2018-03-06 22:43:58
liuyubobobo 回复提问者神经旷野舞者 #2
```
模型打分就是对模型作出评价。准确率，R^2，RMSE等都是。
```
回复有任何疑惑可以回复我~ 2018-03-07 00:51:55

liuyubobobo 2018-03-07 00:54:59

这里的极端数据是指：模型过拟合了验证数据集，但是测试数据集中的数据正好没有检测出来这种情况。这是因为测试数据集只是全部数据集的一部分，此时，依然是：选择哪些数据作为测试数据集，就有偶然情况的影响。

可以再回顾一下交叉验证的思路：数据集中的每一份数据都将参与测试，相应最终的测试结果也会准确很多。

0 回复有任何疑惑可以回复我~

收起回答

提问者神经旷野舞者 #1

老师这种极端情况出现的可能性有多大，感觉碰上的可能性挺小的，我只是感觉也没依据？

回复有任何疑惑可以回复我~ 2018-03-07 11:26:04

liuyubobobo 回复提问者神经旷野舞者 #2

测试数据集越小，碰到的可能性越大。极端情况，你的测试数据集只有一个样本，这个样本预测成功了，你的算法在测试数据集上的表现就是100%正确。但是这个100%正确显然是不可信的。

回复有任何疑惑可以回复我~ 2018-03-07 12:25:46

老师 8-6 6:59 处没有太理解极端数据时什么意思？

正在回答回答被采纳积分+3

2回答

相似问题

请选择置顶位置

本课精华内容

PCA降维的把握和依据分别是什么？比如把一个近似直线分布的二维点数据降维成直线？

关于线性回归中归一化处理和不对归一化处理的问题

数据归一化为什么有用？对归一化无法直观理解

如何判断欠拟合是因为模型选择错误还是超参数选择错误？

学好具体算法和机器学习的实际应用之间有哪些距离？

关于 XGBoost

关于机器学习不同的指标

其他算法的决策边界

在三维数据上的 PCA

关于回归和分类

热搜

最近搜索清空