请稍等 ...
×

采纳答案成功!

向帮助你的同学说点啥吧!感谢那些助人为乐的人

主成分方向的问题,主成分可能有两个方向,实际应该以哪个方向为准?

主成分方向的问题,主成分可能有两个方向,实际应该以哪个方向为准?,另外用协方差求特征向量作为主成分的话,还用对主成分模计算为1吗?

正在回答 回答被采纳积分+3

1回答

liuyubobobo 2022-03-07 02:02:34

如果你说的这两个方向的意思是可能为正可能为负的两个方向的话,这两个方向都可以,随便取一个即可。政府两个方向形成一条直线,这两直线是整个坐标轴。(比如平面坐标系中,x 轴是那条直线。我们规定了右边是正方向,左边是负方向,但如果我们规定左边是正方向,右边是负方向,是完全可以的。)


==========


从“数学量解释”的角度,不管是用什么方法得到的主成分,都可以不标准化(不把模化为1)。因为主成分表示的是一个方向。对于方向来说,模的大小没有意义。(1, 0) 和 (2, 0) 表达的是同一个方向。


但是既然我们已经确定了主成分只是方向而已,模的大小没有意义,我们通常就愿意将其标准化(将模化为 1),这样更能明确它仅仅是一个方向,同时,对于一些可能的后续计算提供方便。(比如 n 个模为 1 的互相垂直的 n 维向量组成的矩阵是标准正交矩阵,那么标准正交矩阵的很多“优美”的性质我们就可以使用。)


这个标准适用于一切数学或者物理或者使用向量的地方。如果这个向量所表征的仅仅是一个方向,就可以将其标准化,仅用一个模为 1 的向量表征方向。


继续加油!:)

0 回复 有任何疑惑可以回复我~
  • 提问者 weixin_慕少409219 #1
    嗯 如果是降维的话 确实哪个方向都可以,比如主成分分析后做回归分析;但是要是根据主成分计算指标综合得分,那么从sklearn里应该是以绝对值最大的点作为正向的方向,应该是这样,老师认可吗?但是有个实际问题,我的主成分指标有数据的记录比较少,这部分记录应该是更有价值的,其他有大部分缺失值,但是经过主成分变化计算综合得分,部分全部为缺失值的分数反而高于一些有数值的记录,那些有数值的记录都是认为比较有效的正向打分。
    回复 有任何疑惑可以回复我~ 2022-03-30 11:59:23
  • 提问者 weixin_慕少409219 #2
    还有对于这个实际问题老师有什么建议?
    回复 有任何疑惑可以回复我~ 2022-03-30 12:00:39
  • liuyubobobo 回复 提问者 weixin_慕少409219 #3
    “根据主成分计算指标综合得分” 这句话没有懂,什么叫根据主成分计算指标综合得分?计算什么指标的综合得分?
    
    “从sklearn里应该是以绝对值最大的点作为正向的方向”这句话也没有看懂。主成分的结果,对于 n 个维度,得到的就是 n 个方向,每个方向的模为 1。什么叫“绝对值最大的点作为正向的方向”?
    
    “我的主成分指标有数据的记录比较少”,这句话也没有懂。什么是“主成分指标有数据的记录”?
    
    但因为你后续的问题有“缺失值”这个关键字。如果你的问题都来自,你的数据本身有大量缺失值的话,解决的思路应该是如何在做具体的分析前,把缺失值处理掉。关于缺失值的处理,这里有一些简单的讨论:https://coding.imooc.com/learn/questiondetail/G4daeRY493bXnWEp.html
    
    继续加油!:)
    回复 有任何疑惑可以回复我~ 2022-03-30 12:09:07
问题已解决,确定采纳
还有疑问,暂不采纳
意见反馈 帮助中心 APP下载
官方微信