我从网上自己找的西瓜书的模拟数据, 尝试着自己去找出合适的K值, 数据集有两种分类, 当k为偶数的时候时候,考虑了距离的权重, 之后把k从1到10 进行遍历, 输出结果很诧异, k= 1, 2, 3,4的时候 准确率都是1, 那么这种情况下,我们k值应 给如何去选取呢??? k=1 可以考虑,,会有过拟合, 那k=2 可以吗? 应该如何去理解呢??? 我们又该如何去理解呢???
另外k的遍历范围是多少合适? 从0开始,上限是数据集数量的平方根????
另外结果出现这个情况,是不是和我自己找的数据有关???