采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
主成分方向的问题,主成分可能有两个方向,实际应该以哪个方向为准?,另外用协方差求特征向量作为主成分的话,还用对主成分模计算为1吗?
如果你说的这两个方向的意思是可能为正可能为负的两个方向的话,这两个方向都可以,随便取一个即可。政府两个方向形成一条直线,这两直线是整个坐标轴。(比如平面坐标系中,x 轴是那条直线。我们规定了右边是正方向,左边是负方向,但如果我们规定左边是正方向,右边是负方向,是完全可以的。)
==========
从“数学量解释”的角度,不管是用什么方法得到的主成分,都可以不标准化(不把模化为1)。因为主成分表示的是一个方向。对于方向来说,模的大小没有意义。(1, 0) 和 (2, 0) 表达的是同一个方向。
但是既然我们已经确定了主成分只是方向而已,模的大小没有意义,我们通常就愿意将其标准化(将模化为 1),这样更能明确它仅仅是一个方向,同时,对于一些可能的后续计算提供方便。(比如 n 个模为 1 的互相垂直的 n 维向量组成的矩阵是标准正交矩阵,那么标准正交矩阵的很多“优美”的性质我们就可以使用。)
这个标准适用于一切数学或者物理或者使用向量的地方。如果这个向量所表征的仅仅是一个方向,就可以将其标准化,仅用一个模为 1 的向量表征方向。
继续加油!:)
嗯 如果是降维的话 确实哪个方向都可以,比如主成分分析后做回归分析;但是要是根据主成分计算指标综合得分,那么从sklearn里应该是以绝对值最大的点作为正向的方向,应该是这样,老师认可吗?但是有个实际问题,我的主成分指标有数据的记录比较少,这部分记录应该是更有价值的,其他有大部分缺失值,但是经过主成分变化计算综合得分,部分全部为缺失值的分数反而高于一些有数值的记录,那些有数值的记录都是认为比较有效的正向打分。
还有对于这个实际问题老师有什么建议?
“根据主成分计算指标综合得分” 这句话没有懂,什么叫根据主成分计算指标综合得分?计算什么指标的综合得分? “从sklearn里应该是以绝对值最大的点作为正向的方向”这句话也没有看懂。主成分的结果,对于 n 个维度,得到的就是 n 个方向,每个方向的模为 1。什么叫“绝对值最大的点作为正向的方向”? “我的主成分指标有数据的记录比较少”,这句话也没有懂。什么是“主成分指标有数据的记录”? 但因为你后续的问题有“缺失值”这个关键字。如果你的问题都来自,你的数据本身有大量缺失值的话,解决的思路应该是如何在做具体的分析前,把缺失值处理掉。关于缺失值的处理,这里有一些简单的讨论:https://coding.imooc.com/learn/questiondetail/G4daeRY493bXnWEp.html 继续加油!:)
登录后可查看更多问答,登录/注册
Python3+sklearn,兼顾原理、算法底层实现和框架使用。
2.5k 19
3.5k 17
2.9k 15
1.6k 15
1.4k 14