老师您好,在写论文的时候用KNN算法,结论里需要给出一个预测的准确率。但其实在数据归一化、超参数网格搜索都完成之前,train_test_split时的随机种子对最后的准确率也是有影响的。
我编写程序,在完成数据归一化和超参数的网格搜索之外,对随机种子进行了从0到999的搜索,发现当随机种子取799时,预测准确率最低为,62.7%,当随机种子取910时,预测准确率最高,为96.1%。
那这个时候到底该怎么评价这个KNN分类器的准确度?
我尝试取1000个随机种子准确率的平均值:83.5%,但是此准确率是没有对应的K值和p值的,因为随机种子不同,网格搜索得到的最佳K值和p值也不同。
另外我对您讲课时用的鸢尾花数据集也在0到99间对随机种子进行了搜索,发现最高100%,最低86.8%,对应的随机种子分别是63和74。相差还是挺大的。