采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
在解决实际问题时,先做数据预处理和特征选择,即特征工程工作。然后再做降维,数据测试切分,然后归一化,然后调用算法,训练得出模型,评估性能。 请问老师,这样的流程是否可以。谢谢!
通常来讲,降维本身也可以理解成一种特征提取。
如果精心进行了特征选择和特征提取,也就不太需要进行降维了。一方面,特征选择和特征提取应该保证了留下的特征都是充分有意义的(压缩空间很小),另一方面,特征选择的过程也进行了降维:)。
但是,如果在做完特征选择以后,你觉得你的数据特征数依然太多,计算资源不允许,你的流程是没有问题的:)
谢谢老师! 再总结下,降维的好处:在处理成千上万维数据时,可降低计算资源消耗,提高计算效率;还有就是特征筛选,选出最重要的几个特征,去掉影响很小的特征和没有影响的因素(后者为噪声)。 量子计算的出现,估计降维的第一个作用估计没什么必要了吧。
纠正一下,PCA的降维过程不是简单的“去掉”某些特征,“留下”某些特征。PCA的过程将整个特征空间从高维空间映射到低维空间,这个映射过程,原始的高维空间的“语意”丢失了。所以很适合原始数据语意本身就“意义不大“的情况,比如图像数据。可以参考这个问答:https://coding.imooc.com/learn/questiondetail/40921.html :)
谢谢老师及时纠偏。
登录后可查看更多问答,登录/注册
Python3+sklearn,兼顾原理、算法底层实现和框架使用。
2.5k 19
3.5k 17
2.9k 15
1.6k 15
1.4k 14