特征的预处理方式有多个，如何同时处理？-慕课网

1回答

liuyubobobo 2018-01-14 01:50:29

很好的问题。由于这个问题主要讲解机器学习算法，所以对于特征预处理没有进行特别讲解，尤其是one-hot-encoder根本没有进行提及。

一种方式是对于这种数据，封装自己的预处理类。具体过程也很简单：首先将整个数据拆成两张表，t1包括x1, x2两列的所有数据，t2包括x3,x4,x5三列的所有数据。之后，对t1做标准化处理，得到t1'；t2做one-hot-encoder，得到t2'。最后t1'和t2'合并得到最终的数据结果即为对数据进行预处理的结果。

如果想使用scikit-learn的体系进行处理，此时不能只是用Pipeline，因为对这两类特征的处理是并行的关系，不是顺序的关系。还需要使用FeatureUnion。感兴趣的话可以在网上搜索一下相关使用方式。文档见这里：http://scikit-learn.org/stable/modules/generated/sklearn.pipeline.FeatureUnion.html

5 回复有任何疑惑可以回复我~

收起回答

特征的预处理方式有多个，如何同时处理？

正在回答

1回答

相似问题

请选择置顶位置

本课精华内容

PCA降维的把握和依据分别是什么？比如把一个近似直线分布的二维点数据降维成直线？

关于线性回归中归一化处理和不对归一化处理的问题

数据归一化为什么有用？对归一化无法直观理解

如何判断欠拟合是因为模型选择错误还是超参数选择错误？

学好具体算法和机器学习的实际应用之间有哪些距离？

关于 XGBoost

关于机器学习不同的指标

其他算法的决策边界

在三维数据上的 PCA

关于回归和分类

热搜

最近搜索清空