使用逻辑回归时怎么利用网格搜索来查找degree,c等超参数-慕课网

1回答

liuyubobobo 回答被采纳获得+3积分 2018-06-04 06:54:23

非常好的问题。如何将自定义的Pipline对象应用于sklearn内置的网格搜索确实是课程没有讲的一个sklearn使用上的语法细节：）

首先，你在31行的注释分析的是正确的。由于此时，你在构建grid_search的时候，传入的算法是log_reg。而log_reg是LogisticRegression的对象，但是创建LogisticRegression是并不需要参数degree，所以，这里会报错。

正确的做法是，我们要对你创建的PolynomialLogisticRegression这个函数返回的对象进行网格搜索。这个函数的逻辑是返回了一个Pipeline的对象，这个Pipeline的对象中创建PolynomialFeatures时使用了degree这个参数。

为了方便起见，在这里，我为这个PolynomialLogisticRegression添加上了默认值。

def PolynomialLogisticRegression(degree = 1, C = 0.1):
    return Pipeline([
        ('poly', PolynomialFeatures(degree=degree)),
        ('std_scaler', StandardScaler()),
        ('log_reg', LogisticRegression(C=C))
    ])
     
poly_log_reg = PolynomialLogisticRegression()

我们需要针对poly_log_reg这个对象进行网格搜索：）

但是，在这里，poly_log_reg中包含三部分，每部分都有自己的参数。按照你写的param_grid，参数名称直接写degree和C，GridSearchCV是无法认得这些参数名隶属于哪一部分的。所以，在这种情况下，我们在设置param_grid的时候，参数名要显示地表明这个参数属于哪个部分。表示的方法是：

1	`{$Pipeline中的对象名称}__{$参数名}`

即，在Pipeline中的对象名称，加上双下换线（__），再加上参数名称。

所以，我们在网格搜索中，要搜索的两个参数名称应该是：

1 2	`poly__degree` `log_reg__C`

其中的poly和log_reg，是你在实例化这个Pipeline对象的时候，给每一部分起的那个名称。

综上，此时我们的param_grid，要这样声明：

C_PARM = [0.1,0.2,0.3,0.4,0.5]
param_grid = [
    {
        'poly__degree': [i for i in range(1, 11)], 
        'log_reg__C': [i for i in C_PARM]
    }
]

现在，就可以按照以前一样的方法使用GridSearchCV啦：）

1 2	`grid_search` `=` `GridSearchCV(poly_log_reg, param_grid)` `grid_search.fit(X_train,y_train)`

整理一遍，我们的整个代码就是这样的：

def PolynomialLogisticRegression(degree = 1,C = 0.1):
    return Pipeline([
        ('poly', PolynomialFeatures(degree=degree)),
        ('std_scaler', StandardScaler()),
        ('log_reg', LogisticRegression(C=C))
    ])
 
# 待进行网格搜索的算法    
poly_log_reg = PolynomialLogisticRegression()
 
# 准备待搜索的参数列表
C_PARM = [0.1,0.2,0.3,0.4,0.5]
param_grid = [
    {
        'poly__degree': [i for i in range(1, 11)], 
        'log_reg__C': [i for i in C_PARM]
    }
]
 
# 实例化GridSearchCV进行网格搜索
grid_search = GridSearchCV(poly_log_reg, param_grid)
grid_search.fit(X_train,y_train)

看起来写了很多，但是自己整理一遍，会发现其实这个语法非常简单：）

加油！

12 回复有任何疑惑可以回复我~

收起回答

提问者慕粉0602482145 #1

非常仔细,非常走心的回答,我一下就看明白了,谢谢老师!!!,真的,十分感谢

回复有任何疑惑可以回复我~ 2018-06-04 10:13:39

lemonlxn #2

老师好，fit之后，如果使用最优参数进行predict，应该要这样写吧 grid_search.best_estimator_.predict(X_test)

回复有任何疑惑可以回复我~ 2019-07-17 18:18:20

liuyubobobo 回复 lemonlxn #3
```
对的：）
```
回复有任何疑惑可以回复我~ 2019-07-18 03:18:45

点开查看后面1条评论

使用逻辑回归时怎么利用网格搜索来查找degree,c等超参数

正在回答

1回答

相似问题

请选择置顶位置

本课精华内容

PCA降维的把握和依据分别是什么？比如把一个近似直线分布的二维点数据降维成直线？

关于线性回归中归一化处理和不对归一化处理的问题

数据归一化为什么有用？对归一化无法直观理解

如何判断欠拟合是因为模型选择错误还是超参数选择错误？

学好具体算法和机器学习的实际应用之间有哪些距离？

关于 XGBoost

关于机器学习不同的指标

其他算法的决策边界

在三维数据上的 PCA

关于回归和分类

热搜

最近搜索清空