使用kernel的理解-慕课网

liuyubobobo 2021-06-16 11:57:39

两个理解都是正确的。

对于你说的第二个问题，是的，可以从多项式核的角度去理解。我们把数据映射到了多项式特征的维度以后，可以线性可分，但这是在新的高维度上可以线性可分，把他打回到原来的数据维度上，依然是线性不可分的，我们创建了一个分线性的决策边界。

继续加油！：）

3 回复有任何疑惑可以回复我~

黄义舜 #1

1）"一，使用核函数的好处是，把低维的特征空间映射到更高维度，这样更容易线性可分" 这个同学这样说准确吗？核函数应该就是方便计算吧（不用把Xi，Xj单独进行变换再点成，直接点成后进行变换，我们不关心Xi和Xj，我们只关心Xi和Xj的乘积）所以我觉得应该这么说 : "一，使用多项式核函数的好处是，节省低维的特征空间映射到更高维度的时间"。

回复有任何疑惑可以回复我~ 2022-09-03 15:42:37

liuyubobobo 回复黄义舜 #2

你的说法是对的，但是，当把数据放到更高的维度，就是更容易线性可分的。（也就是这位同学的说法也是对的。）

如果用简单的例子理解，你可以想象，在一维空间（一条线）上的样本，如果是这样的：

```
A B A B
```

它不是线性可分的。但是，如果在二维，可能就是这样的了

```
A    A

  B      B
```

他就是线性可分的了。

再比如，这样的二维样本分布，不是线性可分的：

```
A   B

B   A
```

但是，把他拉升到三维，你可以想象一下，如果“恰好”，B 样本都在 z 方向下降了一些；A 样本都在 z 方向上上升了一些，他们就是线性可分的了。

我们如果来看上面的这个从二维到三维的升维，相当于对着四个样本点都添加了一个 z 坐标。此时，除非这四个样本点升到三维空间以后，依然共面，否则，他们就一定共线性可分了。你可以直观地想象，增加一个 z 坐标以后，他们线性可分的概率大大增加了。

为什么会这样，还是因为维度灾难。简单来说，在高维空间里，同样数据的点，分布更稀疏了。比如在三维空间里，8 个点可以占据三维空间的一个“单元格”（每一维度的坐标或者为 0 或者为 1）的所有“顶点”。但是，在一个 3000 维的空间里，一个单元格的顶点能放 2^3000 次方个点，这个数字比宇宙所有的原子的数量还要多。你可以直观想象，8 个点可以把三维空间的单元格“占满”，但是 8 个点对于 3000 维空间来说，少得可怜。参考这个问答：https://coding.imooc.com/learn/questiondetail/G8glLYlJxQk6xpDa.html

所以，在一个高维空间，同样数量的样本，变得更稀疏了（而非更拥挤了），样本之间的距离被拉大了（而非缩小了。3000 维度空间的“单元格”的对角线距离远高于三维空间）所以他们更容易被区分了，也更容易被线性可分了。

这其实就是 SVM 的 rgb 核更容易过拟合的原理。在高维空间里，我们找到了一条“高维空间中的线”把样本很好的做了分类，再放回低维空间看，就变成那种不规则形状了。（印象中课程会对 SVM 的 rgb 核的决策边界做画图让大家直观看到的。）

继续加油！：）

回复有任何疑惑可以回复我~ 2022-09-03 23:59:29

黄义舜回复 liuyubobobo #3

哦，我明白了，确实是升维之后，更可以线性可分了，我没看全。谢谢bobo老师。

回复有任何疑惑可以回复我~ 2022-09-04 10:34:45

使用kernel的理解

正在回答回答被采纳积分+3

1回答

相似问题

请选择置顶位置

本课精华内容

PCA降维的把握和依据分别是什么？比如把一个近似直线分布的二维点数据降维成直线？

关于线性回归中归一化处理和不对归一化处理的问题

数据归一化为什么有用？对归一化无法直观理解

如何判断欠拟合是因为模型选择错误还是超参数选择错误？

学好具体算法和机器学习的实际应用之间有哪些距离？

关于 XGBoost

关于机器学习不同的指标

其他算法的决策边界

在三维数据上的 PCA

关于回归和分类

热搜

最近搜索清空