采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
老师你好,关于Grid search为什么通过fit()喂了训练集之后就会得到最佳效率输出呢,一般不是只有fit之后通过测试集才会有效率输出吗?这里有点不理解,上一节的网格搜索的最佳超参数也是通过测试集产出的呀
很好的问题。
简单来说,grid_search 内部有一套“测试机制”。grid_search 内部是针对每一套参数,都进行了训练,然后在内部,就是用另一套测试机制,测试出了这套参数的好坏,然后 grid_search 返回的是根据这套测试机制,得到的最好的测试结果对应的参数。
这套测试机制是什么?叫做 Cross Validation(交叉验证),这就是 grid search 所对应的类 GridSearchCV 中 CV 两个字母的意思。(Cross Validation 的首字母。)
具体交叉验证的机制是怎样的?这个课程的后续会具体介绍的。可以在课程后续学习了交叉验证以后,再回过头来想一下这个问题:)
继续加油!:)
也就是说grid_search中用的训练集合测试集都是fit函数中传入的数据 这样来理解吧!? 感谢老师的解答!
对。但不是将整个传进去的 X_train 作为测试集,而是分割出一部分。(具体 CV 的逻辑比这句话要复杂一些:))
登录后可查看更多问答,登录/注册
Python3+sklearn,兼顾原理、算法底层实现和框架使用。
2.6k 19
3.6k 17
3.1k 15
1.7k 15
1.5k 14