采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
什么样的数据适合pca降维,什么样的数据不适合?最近在学习autoEncoder,什么样的数据又适合这种非线性的降维呢?
PCA最大的假设是线性!PCA的过程是在n维空间中,经过线性变换,找到其低维的子空间。这里的关键词是线性。如果你的线性代数足够好,可以再仔细理解一下PCA的数学解:)
以二维空间为例,如果进行降维,PCA只能找到直线的子空间;以三维空间为例,如果进行降维,PCA只能找到平面的子空间(二维)或者直线的子空间(一维)。如果你的数据分布在一个低维的非线性空间中,PCA是找不到的,此时,就需要非线性降维算法了:)
老师能不能举例说明什么是低维非线性空间呢
y = x是线性的。y=x^2是非线性的。都是一维空间(只有一个特征)。
同理,z = x + y是线性的;z = x^2 + y^2 是非线性的。都是二维空间(只有两个特征)。前者是平面,后者是曲面。
登录后可查看更多问答,登录/注册
Python3+sklearn,兼顾原理、算法底层实现和框架使用。
2.5k 19
3.5k 17
2.9k 15
1.6k 15
1.4k 14