对于特征数远远大于样本数的数据，高斯核是否相当于降维？-慕课网

1回答

liuyubobobo 2020-08-27 03:22:21

不能将高斯核理解成降维，高斯核本质还是将数据映射到了无穷维，可以参考这里的讨论：http://coding.imooc.com/learn/questiondetail/146193.html

高斯核不能和 PCA 相提并论。除了高斯核的本质并不是降维之外，二者之间最大的本质区别是：PCA 是线性的，高斯核是非线性的。

如果处理特征数远大于样本数的情况，核心还是要做预处理。或者在数据预处理阶段，对数据进行降维，特征选择，等等方式，让数据的维度降下来；或者增加数据量，让样本数升上去；或者二者兼有。完全靠算法本身处理这个问题并不靠谱。依然是，数据预处理是时间机器学习过程中非常重要的一步。

你说的共线性问题，从道理上，解决方案也应该在数据预处理上，应该尽量在数据预处理中，找到共线性的特征，将他们尽量剔除，而不是指望算法能够自动识别。不过我一般处理数据很少去看共线性问题，我老婆做一些工作需要做统计分析对此比较敏感。但机器学习很多时候只关注最终预测结果的准确率，而不去看相关，显著这些统计指标，所以可能并不 care 共线性，可以根据自己实际的需求做取舍。

继续加油！：）

2 回复有任何疑惑可以回复我~

收起回答

对于特征数远远大于样本数的数据，高斯核是否相当于降维？

正在回答

1回答

相似问题

请选择置顶位置

本课精华内容

PCA降维的把握和依据分别是什么？比如把一个近似直线分布的二维点数据降维成直线？

关于线性回归中归一化处理和不对归一化处理的问题

数据归一化为什么有用？对归一化无法直观理解

如何判断欠拟合是因为模型选择错误还是超参数选择错误？

学好具体算法和机器学习的实际应用之间有哪些距离？

关于 XGBoost

关于机器学习不同的指标

其他算法的决策边界

在三维数据上的 PCA

关于回归和分类

热搜

最近搜索清空