请稍等 ...
×

采纳答案成功!

向帮助你的同学说点啥吧!感谢那些助人为乐的人

降维处理

图片描述
老师,这里第一次降维处理,比如数据集有4个维度的数据
参数为4,这里的意思是计算出各个维度下数据的方差吗?然后保留了方差大的维度,舍弃了方差小的维度 是为什么呢?是不是方差大的维度,维度下的各个数据的关联性很小,可以作为分析的依据,方差小的维度下的各个数据关联性很大,差别很小,就是说这个维度的数据对于整个数据集的分析作用小一些,所以舍弃。

正在回答 回答被采纳积分+3

1回答

flare_zhao 2020-11-29 14:13:06

数据降维的目标就是要让数据在更低维度情况下,保留主要的信息。PCA降维的原理是让数据在低维度投影后能尽可能分开,通过方差,可以体现数据的离散程度,方差越大,说明数据分的越开,因此我们通过方差来作为评估信息在降维后保留的情况。如果完全不想丢失任何信息,那肯定是不降维。但因为实际需要,要降低维度,那就优先剔除方差比例更小的维度数据。

0 回复 有任何疑惑可以回复我~
  • 提问者 进击的蜂蜜 #1
    一开始的维度为4,如果参数n_components=4,是计算的各个维度下数据的方差吗
    回复 有任何疑惑可以回复我~ 2020-11-30 21:18:19
  • 提问者 进击的蜂蜜 #2
    不是太理解一开始同维度进行PCA分析的意义
    回复 有任何疑惑可以回复我~ 2020-11-30 21:23:33
  • flare_zhao 回复 提问者 进击的蜂蜜 #3
    主成分分析,会进行数据的标准化处理,因此可以踢出比如不同维度数量级不同而影响信息的重要性。
    回复 有任何疑惑可以回复我~ 2020-11-30 21:29:24
问题已解决,确定采纳
还有疑问,暂不采纳
意见反馈 帮助中心 APP下载
官方微信