为什么knn算法的k越小模型会越复杂？-慕课网

1回答

liuyubobobo 2018-01-23 03:20:38

直观地理解，过拟合就是学习到了很多“局部信息”，或者是“噪音”，使得我们的模型中包含很多“不是规律的规律”。在knn算法中，k越小，就越有可能让我们的学习结果被“局部信息”所左右。在极端情况下，k=1，knn算法的结果只由离我们待预测样本最近的那个点决定，这使得我们knn的结果高概率被“有偏差的信息”或者“噪音”所左右，是一种过拟合。

一个简单的可视化看过拟合的方式，是看决策边界的形状。“决策边界”的概念会在下一章介绍。决策边界越不规则，越有可能是过拟合。因为不规则的决策边界意味着数据的特征稍微有一点微小的变化，我们的分类算法就可能改变分类结果，也就是所谓的对噪音很明显。我们可以使用我们在这个课程中后续一直使用的plot_decision_boundary这个函数，来观察一下knn中，对k不同的取值，决策边界的不同。可以考虑看完下一章，再回头看下面的图示。在这里，我简单绘制了对于iris数据，knn中的k取值不同，决策边界的不同。很显然，k越小，决策边界越不规则：）

代码参见：https://github.com/liuyubobobo/Play-with-Machine-Learning-Algorithms/blob/master/09-Logistic-Regression/Optional-01-kNN-Decision-Boundary/Optional-01-kNN-Decision-Boundary.ipynb

10 回复有任何疑惑可以回复我~

收起回答

神经旷野舞者 #1

之前也有类似问题，模模糊糊地理解了下，从图上看更好理解了，比用文字描述简单多了

回复有任何疑惑可以回复我~ 2018-03-06 16:04:33

相声皇后粉丝后援会 #2
```
很直观的理解，恍然大悟！
```
回复有任何疑惑可以回复我~ 2018-04-21 21:40:32

慕标1049315 #3

我补充一点。knn和神经网络不一样的一点在于，knn并没有需要训练的参数。fit只是记住了训练数据（和标签）。在预测时，输入测试数据，根据你指定的k去取最近的k个点然后投票。因此，k越小，投票结果越容易受到个别点的影响。体现在决策边界就是“弯弯曲曲”。学习到了更多细节，所以说模型更复杂。

回复有任何疑惑可以回复我~ 2021-05-19 15:12:02

为什么knn算法的k越小模型会越复杂？

正在回答

1回答

相似问题

请选择置顶位置

本课精华内容

PCA降维的把握和依据分别是什么？比如把一个近似直线分布的二维点数据降维成直线？

关于线性回归中归一化处理和不对归一化处理的问题

数据归一化为什么有用？对归一化无法直观理解

如何判断欠拟合是因为模型选择错误还是超参数选择错误？

学好具体算法和机器学习的实际应用之间有哪些距离？

关于 XGBoost

关于机器学习不同的指标

其他算法的决策边界

在三维数据上的 PCA

关于回归和分类

热搜

最近搜索清空