请稍等 ...
×

采纳答案成功!

向帮助你的同学说点啥吧!感谢那些助人为乐的人

流程问题:先是特征选择然后再做降维。

在解决实际问题时,先做数据预处理和特征选择,即特征工程工作。然后再做降维,数据测试切分,然后归一化,然后调用算法,训练得出模型,评估性能。
请问老师,这样的流程是否可以。谢谢!

正在回答

1回答

liuyubobobo 2018-02-10 13:59:40

通常来讲,降维本身也可以理解成一种特征提取。

如果精心进行了特征选择和特征提取,也就不太需要进行降维了。一方面,特征选择和特征提取应该保证了留下的特征都是充分有意义的(压缩空间很小),另一方面,特征选择的过程也进行了降维:)。


但是,如果在做完特征选择以后,你觉得你的数据特征数依然太多,计算资源不允许,你的流程是没有问题的:)

2 回复 有任何疑惑可以回复我~
  • 提问者 慕慕9414451 #1
    谢谢老师!
    再总结下,降维的好处:在处理成千上万维数据时,可降低计算资源消耗,提高计算效率;还有就是特征筛选,选出最重要的几个特征,去掉影响很小的特征和没有影响的因素(后者为噪声)。
    量子计算的出现,估计降维的第一个作用估计没什么必要了吧。
    回复 有任何疑惑可以回复我~ 2018-02-10 14:10:31
  • liuyubobobo 回复 提问者 慕慕9414451 #2
    纠正一下,PCA的降维过程不是简单的“去掉”某些特征,“留下”某些特征。PCA的过程将整个特征空间从高维空间映射到低维空间,这个映射过程,原始的高维空间的“语意”丢失了。所以很适合原始数据语意本身就“意义不大“的情况,比如图像数据。可以参考这个问答:https://coding.imooc.com/learn/questiondetail/40921.html :)
    回复 有任何疑惑可以回复我~ 2018-02-10 14:16:56
  • 提问者 慕慕9414451 回复 liuyubobobo #3
    谢谢老师及时纠偏。
    回复 有任何疑惑可以回复我~ 2018-02-10 14:17:58
问题已解决,确定采纳
还有疑问,暂不采纳
意见反馈 帮助中心 APP下载
官方微信