表使样本点间距增大的方法应该有很多吧，把样本投影到x轴然后在延展x轴的方法会不会更好实现呢？-慕课网

1回答

liuyubobobo 2023-03-09 04:02:26

主成分分析法不应该是降维吗？

主成分分析法就是在降维。

把样本投影到x轴然后在延展x轴的方法会不会更好实现呢？

如这一小节的介绍，更好实现不意味着“效果更好”。在计算机科学中，更好实现从来都不是目标。

为什么要找样本点间距最大的那条直线呢？

因为样本点间距最大的那条线最大程度的保留了样本之间的信息，效果最好。可以参考这里：https://coding.imooc.com/learn/questiondetail/vZnjEY7V23eP72Wd.html 和

https://coding.imooc.com/learn/questiondetail/36607.html

开始我以为PCA是通过把有线性关系或非线性关系的几个特征用一个特征表示，达到降维的目的。

这是理解主成分分析非常非常重要的一点：主成分分析不是“找几个重要特征”进行降维，不是做“特征选择”。PCA 降维后的结果，新的维度的语义会消失，就是因为这个原因。可以参考这里：https://coding.imooc.com/learn/questiondetail/mg5J7RPqlzB68Zw1.html

对于为啥要让样本的方差最大化，我的理解是，使方差最大化可以尽可能的保留原始数据之间的额关系，减少特征与特征之间信息的丢失？

完全正确。

继续加油！：）

0 回复有任何疑惑可以回复我~

收起回答

提问者猫多余 #1

好的老师，关于降维我还有个疑问，就是比如样本数据中有三个特征，其中特征1和特征2在二维坐标中满足类似
特征1=2*特征2+5这样的函数表达形式，而且写成这个函数关系也满足这俩个样本间的方差最大化，那我们是不是就可以把特征1的数据通过这个函数表达式来表示成特征1呢？然后特征1和特征2的数据可以合并为：
特征1+特征2=3*特征2+5  
这样少了一个参数是不是也可以是降维呢？
我这样的想法似乎和PCA寻找新的正交基不太一样，但是不是也可以达到降维的目的呢？
谢谢老师！

回复有任何疑惑可以回复我~ 2023-03-09 17:08:33

liuyubobobo 回复提问者猫多余 #2

可以。但是这个前提是你知道了”特征1=2*特征2+5“这个信息。当你知道了这个信息以后，实际上就已经知道了一个特征是冗余的。就可以将其直接剔除掉。这其实是一个挺标准的特征预处理的步骤（如果发现两个特征极度相关，就可以剔除了。）。

但是，如果你并不知道这个信息，为了获得这个信息，你就需要依次验证两个维度之间是否相关，这在高维度下是非常耗时的。而只有高维度，才有降维的必要性；
另一方面，即使维度之间两两不存在这样的相关性，PCA 依然能很好的运转。

继续加油！：）

回复有任何疑惑可以回复我~ 2023-03-09 17:20:55

提问者猫多余回复 liuyubobobo #3
```
懂了懂了，谢谢老师！：）
```
回复有任何疑惑可以回复我~ 2023-03-09 18:14:22

表使样本点间距增大的方法应该有很多吧，把样本投影到x轴然后在延展x轴的方法会不会更好实现呢？

正在回答回答被采纳积分+3

1回答

相似问题

请选择置顶位置

本课精华内容

PCA降维的把握和依据分别是什么？比如把一个近似直线分布的二维点数据降维成直线？

关于线性回归中归一化处理和不对归一化处理的问题

数据归一化为什么有用？对归一化无法直观理解

如何判断欠拟合是因为模型选择错误还是超参数选择错误？

学好具体算法和机器学习的实际应用之间有哪些距离？

关于 XGBoost

关于机器学习不同的指标

其他算法的决策边界

在三维数据上的 PCA

关于回归和分类

热搜

最近搜索清空