pipeline-慕课网

liuyubobobo 2018-06-14 02:43:20

如果你不使用GridSearchCV，直接使用Pipeline进行训练的话，可以在创建 Pipeline 的外面创建LogisticRegression的对象log_reg。将这个log_reg传给Pipeline之后，在Pipeline训练以后，直接取log_reg的coef_即可。完整的代码示意如下图（省略模拟数据的创建过程）：

但是如果你使用GridSearchCV进行网格搜索，则不一样。因为GridSearchCV内部要尝试不同的参数组合，所以会创建多个LogisticRegression的实例对象，而不会把最终结果存在你传的log_reg的实例中。所以对于GridSearchCV，在训练以后，应该调用best_estimator_（存放搜索后参数最优的那个Pipeline对象）中的named_steps数组（存放Pipeline中每一步的实例对象）相应log_reg那个名字的coef_。具体代码示例如下：

其实，named_steps数组是Pipeline的参数（此时，grid_search.best_estimator_）是Pipeline的一个对象。所以，其实在我说的第一种情况，不使用GridSearchCV进行网格搜索的时候，要想获得log_reg的coef_，也并不需要一定在Pipeline的外面创建LogisticRegression的实例对象，而同样可以使用named_steps的方式获得，有兴趣可以试试看，加深一下对Pipeline这个类的理解：）

加油！：）

1 回复有任何疑惑可以回复我~

收起回答

提问者慕先生6474118 #1
```
感谢 bobo 老师详细的解答~ ?
```
回复有任何疑惑可以回复我~ 2018-06-14 20:08:59

慕粉4186965 2019-07-08 22:07:00

但是对于name_steps得到的系数，差距有点大

0 回复有任何疑惑可以回复我~

收起回答

liuyubobobo #1

可以参考这里：http://coding.imooc.com/learn/questiondetail/130281.html

回复有任何疑惑可以回复我~ 2019-07-10 00:58:47

提问者慕先生6474118 2018-06-13 21:15:18

或者还是说一般逻辑回归对于线性的决策边界是白盒子；但是对于非线性的决策边界，即使是degree=3的简单情况，对于十几维的特征空间，引入多项式后维数也达到了很大的一个级别，这时是不是不方便看每个特征对应的系数，查看对结果的影响因子了？就也成黑盒子了；

0 回复有任何疑惑可以回复我~

收起回答

提问者慕先生6474118 2018-06-13 14:11:42

会报错

0 回复有任何疑惑可以回复我~

收起回答

pipeline

正在回答回答被采纳积分+3

4回答

相似问题

请选择置顶位置

本课精华内容

PCA降维的把握和依据分别是什么？比如把一个近似直线分布的二维点数据降维成直线？

关于线性回归中归一化处理和不对归一化处理的问题

数据归一化为什么有用？对归一化无法直观理解

如何判断欠拟合是因为模型选择错误还是超参数选择错误？

学好具体算法和机器学习的实际应用之间有哪些距离？

关于 XGBoost

关于机器学习不同的指标

其他算法的决策边界

在三维数据上的 PCA

关于回归和分类

热搜

最近搜索清空

pipeline

正在回答 回答被采纳积分+3

4回答

相似问题

请选择置顶位置

本课精华内容

PCA降维的把握和依据分别是什么？比如把一个近似直线分布的二维点数据降维成直线？

关于线性回归中归一化处理和不对归一化处理的问题

数据归一化为什么有用？对归一化无法直观理解

如何判断欠拟合是因为模型选择错误还是超参数选择错误？

学好具体算法和机器学习的实际应用之间有哪些距离？

关于 XGBoost

关于机器学习不同的指标

其他算法的决策边界

在三维数据上的 PCA

关于回归和分类

正在回答回答被采纳积分+3