Normalizer 和 StandardScaler/MinMaxScaler 的区别-慕课网

1回答

liuyubobobo 2021-06-24 18:56:33

你查到的：拥有统一标准，将其转换为“单位向量” 和我说的“使不同的特征数据在同一量纲下”是一个意思。

“但感觉对normalizer还是有点疑惑”你的具体疑惑是什么？

从数学的角度来讲，如果你的数据服从正态分布，使用 StandardScaler 的效果更好。但整体因为真实世界大量数据都是服从或者可以认为近似服从正态分布的，所以 StandardScaler 的应用更广一些。（即使不知道数据服从的分布，在大多数情况下，假设正态分布，问题是不大的。另外，还有一些数学方法，可以让数据从其他分部转换成正态分布。）

而 MinMaxScaler 的特点是仅仅对数据进行了缩放（StandardScaler 由于除以的标准差中包含开根号等操作，所以不是线性的。）

值得一提的是，对于这种 scaler 操作，StandardScaler 和 MinMaxScaler 并非全部的 scale 数据的方式。如果数据有 outlier 的话，sklearn 还提供了 RobustScaler：https://scikit-learn.org/stable/modules/generated/sklearn.preprocessing.RobustScaler.html#sklearn.preprocessing.RobustScaler

但其实，对于 outlier，如果不是特殊情况，更好的方式是从数据集中剔除 outlier。

继续加油！：）

0 回复有任何疑惑可以回复我~

收起回答

Normalizer 和 StandardScaler/MinMaxScaler 的区别

正在回答回答被采纳积分+3

1回答

相似问题

请选择置顶位置

本课精华内容

PCA降维的把握和依据分别是什么？比如把一个近似直线分布的二维点数据降维成直线？

关于线性回归中归一化处理和不对归一化处理的问题

数据归一化为什么有用？对归一化无法直观理解

如何判断欠拟合是因为模型选择错误还是超参数选择错误？

学好具体算法和机器学习的实际应用之间有哪些距离？

关于 XGBoost

关于机器学习不同的指标

其他算法的决策边界

在三维数据上的 PCA

关于回归和分类

热搜

最近搜索清空