采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
老师MNIST数据集不需要归一化,是因为特征都是同一个尺度,是不是说即使样本中第1个特征像素的像素值只有0,255两个值,也不需要归一化,但是感觉这样需要来个均值方差标准化吧?0和255不是outlier吗?
对,因为他们本身都在一个尺度了。
如果肯定数据有outlier,更应该去除outlier。归一化的目的更多的是在一般情况下不要产生因量纲不同而导致的问题。请回忆4-7小节一开始所举的例子。
同一个尺度就是同一类特征属性了,比如都是一张图像的像素, 去除outlier就是用pca降噪了?
降噪和去outlier不一样。去除outlier直接将你识别出的outlier从数据集中删除就好了。
查了下,那个单个像素应该属于噪声点了,离群点应该是明显偏离正常值的
登录后可查看更多问答,登录/注册
Python3+sklearn,兼顾原理、算法底层实现和框架使用。
2.5k 19
3.5k 17
2.9k 15
1.6k 15
1.4k 14