标准化(Standardization,又可以叫均值方差归一化)和最值归一化(Normalization,又可以叫最大最小归一化)都是Feature Rescaling的方法。他们的目的是一样的:都是将数据的特征放到同一个尺度下。
最值归一化感觉很好理解,就是比例缩放,但是均值方差标准化不那么直观 。
我理解是X-X平均值就得到X偏离均值的程度,然后标准差就是整体的偏离程度,然后相除就得到每个值的偏离比例,这样就对偏离成对进行归一化。然后得到无偏的数据,那这样有偏的特征不是被掩盖了吗?
感觉这么理解有些别扭,有没有其他的解释了,概率没学明白。
登录后可查看更多问答,登录/注册