请稍等 ...
×

采纳答案成功!

向帮助你的同学说点啥吧!感谢那些助人为乐的人

关于Grid Search处理knn中超参数的问题

用knn处理一个样本数为15的样本数据,其中我将test_size设置为0.2,即12条数据用于train,3条数据用于test。
使用Grid Search来寻找最优的超参数时,输入 ‘n_neighbors’: [i for i in range(1, 11)]‘,按实际情况来说并没有超出样本数量,但是程序报错,显示以下提示:
ValueError: Expected n_neighbors <= n_samples, but n_samples = 8, n_neighbors = 9
想知道报错的具体原因,是否因为grid search自身会分割训练数据集和测试数据集。

正在回答

1回答

liuyubobobo 2018-10-20 15:35:34

是的。因为GridSearch本身使用的是交叉验证的方式,而非简单的训练,测试数据集划分的方式,来验证算法的性能:)


具体交叉验证的机制,会在第八章进行介绍:)


加油!:)

0 回复 有任何疑惑可以回复我~
问题已解决,确定采纳
还有疑问,暂不采纳
意见反馈 帮助中心 APP下载
官方微信