采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
均值方差归一化能处理数据没有明确边界的情况,那么如果数据有明确边界,这两个归一化方法哪个更适合呢?为什么
基本上数据有明显边界是唯一能用最值归一化的情况。但注意,我的用词是“能用”,而非此时“最值归一化最好”。因为什么叫数值有明显边界其实是一个很主观的概念。(什么叫明显?)
比如人的身高,其实是有明显边界的,超不过 3 米吧?矮不过 0 米吧?但其实对于身高数据来说,在大多数情况下,使用 standardization 是最好的。
如果一定要说最值归一化什么时候最好,可能再加一个限定条件:数据分布均匀(符合完均匀分布)是最好的。但其实,此时,其实最值归一化其实和标准化的效果是差不多的。并且,我们很有可能还是希望做标准化,因为标准化可以保证方差为 1。
在实践中,标准化基本上是最常用且最不会出问题的。因为对于真实数据老说,均匀分布其实不是一种常态,正态分布才是。
继续加油!:)
登录后可查看更多问答,登录/注册
Python3+sklearn,兼顾原理、算法底层实现和框架使用。
2.5k 19
3.5k 17
2.9k 15
1.6k 15
1.4k 14