请稍等 ...

关于降维的问题

想问一下降维时为什么要让样本间间距最大，即方差最大，为什么这样就能够最大程度的保持原样本的特性？

qq_雨后天晴_0 2019-04-23 11:42:11

源自：7-1 什么是PCA

953

收起

提交取消

1回答

liuyubobobo 回答被采纳获得+3积分 2019-04-23 11:57:24

首先，你要理解课程里的这个例子：对于这组样本：

以下两种方式都是不好的（即降维到横坐标或者纵坐标）

因为，他们没有最大程度反应原来数据之间的关系。

最好的是什么样子？大概是这个样子：

这个样子具体看是怎样的？其实就是在把所有的样本映射到一条直线以后，这些点之间的距离最大的保留了下来。设想一下，其他的直线，这些点映射以后，他们之间的距离只有可能更近。我们要尽量的区分不同的样本点。

“把所有的样本映射到一条直线以后，这些点之间的距离最大的保留了下来”，这句话用数学的语言表示，就是让这些样本映射到一根直线上，方差尽量的大。

继续加油！：）

1 回复有任何疑惑可以回复我~

提问者 qq_雨后天晴_0 #1
```
非常感谢！
```
回复有任何疑惑可以回复我~ 2019-04-25 12:00:30

相似问题

PCA降维的维度问题

PCA降维的把握和依据分别是什么？比如把一个近似直线分布的二维点数据降维成直线？

流程问题:先是特征选择然后再做降维。

关于PCA的降噪操作有一个地方不理解

降维处理

登录后可查看更多问答，登录/注册

Python3入门机器学习经典算法与应用

参与学习 5985 人
提交作业 300 份
解答问题 2456 个

Python3+sklearn，兼顾原理、算法底层实现和框架使用。

了解课程

本课精华内容

问答作业

PCA降维的把握和依据分别是什么？比如把一个近似直线分布的二维点数据降维成直线？

3.5k 19

关于线性回归中归一化处理和不对归一化处理的问题

4.5k 17

数据归一化为什么有用？对归一化无法直观理解

4.1k 15

如何判断欠拟合是因为模型选择错误还是超参数选择错误？

2.2k 15

学好具体算法和机器学习的实际应用之间有哪些距离？

2.2k 14

查看更多本课问答

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

扫描二维码
关注慕课网微信公众号