参数设置-慕课网

1回答

liuyubobobo 回答被采纳获得+3积分 2020-11-13 19:14:07

关于随机种子，可以参考这里：http://coding.imooc.com/learn/questiondetail/102278.html

不需要对随机种子，包括 train test 分配的比例做搜索。可以参考这里：http://coding.imooc.com/learn/questiondetail/196103.html

train test split 的意思就是，拿出一部分数据（test），假装这部分数据你根本就不知道，只是用 train 做模型训练，看效果是怎样的。你不知道的数据，也就不需要搜索。更正规的数据集，直接规定了什么是测试数据，你也就不需要 split 了。比如 MNIST（课程后续会介绍）

另外，更严格的测试方式是使用交叉验证，课程后续也会介绍。

继续加油！：）

2 回复有任何疑惑可以回复我~

收起回答

提问者 ITMOCC #1

那如何解释种子的值不同导致准确率不同呢？可以理解为种子值不同会产生不同的随机排列吗？那不设种子是不是每次准确率都不一样？还有如果不是用数据集来实现算法。而是工作中的实际数据呢？该如何确定测试集和训练集的比例呢？用交叉验证吗？

回复有任何疑惑可以回复我~ 2020-11-28 21:06:59

liuyubobobo 回复提问者 ITMOCC #2

1，是的，如果种子不同，准确率不一样。就是因为不同种子随机分配的数据不同；2，工作中的数据集和我们现在用的数据集是一样的。没有“完美的划分训练数据集和测试数据集”的方式。交叉验证没有解决这个问题，请仔细复习交叉验证的过程。交叉验证也需要划分训练数据和测试数据集。如果真想抵抗这个问题带来的后果，那就是整体数据集越大越好，你能够获得的数据越多，涵盖的情况越全面，即便随机划分，得到的结果出入也不会太大。

回复有任何疑惑可以回复我~ 2020-11-28 23:38:42

参数设置

正在回答

1回答

相似问题

请选择置顶位置

本课精华内容

PCA降维的把握和依据分别是什么？比如把一个近似直线分布的二维点数据降维成直线？

关于线性回归中归一化处理和不对归一化处理的问题

数据归一化为什么有用？对归一化无法直观理解

如何判断欠拟合是因为模型选择错误还是超参数选择错误？

学好具体算法和机器学习的实际应用之间有哪些距离？

关于 XGBoost

关于机器学习不同的指标

其他算法的决策边界

在三维数据上的 PCA

关于回归和分类

热搜

最近搜索清空