采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
因为每个主成分都是减掉分量后,再求第一个主成分的方法,得到一组主成分,每个主成分的方差比例怎么理解的?
每个主成分都解释了原始数据方差的一部分。每个主成分解释的方差量越大,说明这个主成分越重要。
所以我们的算法是首先寻找:把数据投影到一个坐标轴上以后,能最大化方差的那个坐标轴,作为第一主成分;之后将这个坐标轴上的影响减去,找对于剩下的数据的第一主成分;这个过程以此类推。
确实有点难想啊,求第2个主成分可以通过减去第一个主成分分量的过程。
不要纯粹的想象,用低维数据实际去实验,看数据点是如何变化的。课程中使用的是二维数据,如果认为比较难以说明问题,可以自己设置一个数据量比较少(比如只有5个点)的三维数据,先求第一主成分->映射(此时所有点将在一个平面上)->求第二主成分->映射(此时所有点将在一条直线上)->求第三主成分(剩下的在一条直线上的所有点所在的直线就是第三主成分)。如果熟悉三维空间的可视化方法可以进行可视化理解的话,更好。
之前以为n维空间求主成分,每次都是映射到一条直线上吧,这样能直接看出分布是否足够分散,难道是每次映射到n-1维平面上吗?那这个主成分应该是多个向量表示吧,而不是一个w向量就能表示的吧?
登录后可查看更多问答,登录/注册
Python3+sklearn,兼顾原理、算法底层实现和框架使用。
3.1k 19
4.2k 17
3.6k 15
2.0k 15
1.9k 14
购课补贴联系客服咨询优惠详情
慕课网APP您的移动学习伙伴
扫描二维码关注慕课网微信公众号