ConvergenceWarning-慕课网

1回答

liuyubobobo 2021-01-19 18:12:10

首先，一个算法适合小数据集，不代表所有小数据集都一定有效。只是统计意义上，这个算法在小数据集上，作用的效果更好。

以 iris 数据及为例，我测试了一下，现在默认的 LogisticRegression 确实不收敛。

解决不收敛的方式，通常有两种，其实课程中都提及过：

1）增加迭代次数。所谓不收敛，是在有限次迭代中没有收敛。LogisticRegression 默认的迭代次数 max_iter 是 100，我试了一下，max_iter 设置为 1000 就可以收敛。

2）另一个方式非常建议，就是对数据做标准化。在讲线性回归的时候介绍过，对于一些算法，标准化虽然在理论上不影响最终的结果，但是会让搜索更容易进行。

继续加油！：）

0 回复有任何疑惑可以回复我~

收起回答

提问者 ITMOCC #1

老师，我想问的是同样一组数据用Ibfgs不收敛，用liblinear就收敛了，或者说用Ibfgs迭代次数要1000次才收敛，而liblinear100次就行了。这是不是说明liblinear比Ibfgs的性能更好啊？（用liblinear更容易收敛）。再有对于那些课程中人造的数据，用默认的Ibfgs100次也能收敛，是因为数据太简单了吗？

回复有任何疑惑可以回复我~ 2021-01-19 18:52:42

liuyubobobo 回复提问者 ITMOCC #2

是的，对于二分类问题，liblinear 性能更好，但是 liblinear 无法直接求解多分类问题的损失函数的最优解，所以只能使用 OvR 的方式处理多分类问题的最优解。而 Ibfgs 可以直接求解多分类问题。所以，当数据达到一定程度，OvR 的性能就有问题了，这就是 liblinear 更适合小规模数据的原因，同时，我怀疑也是 sklearn 更新为将 Ibfgs 作为 solver 的默认方法的原因。课程中人造的数据，用默认的Ibfgs100次也能收敛，是因为数据太简单了，函数的收敛性太强了。

回复有任何疑惑可以回复我~ 2021-01-19 19:11:03

提问者 ITMOCC 回复 liuyubobobo #3

好的。老师另外LogisticRegressionCV里的refit和C是什么意思，sklearn文档里说的我不太明白，您能解释解释吗？

回复有任何疑惑可以回复我~ 2021-01-19 21:18:28

点开查看后面1条评论

ConvergenceWarning

正在回答回答被采纳积分+3

1回答

请选择置顶位置

本课精华内容

PCA降维的把握和依据分别是什么？比如把一个近似直线分布的二维点数据降维成直线？

关于线性回归中归一化处理和不对归一化处理的问题

数据归一化为什么有用？对归一化无法直观理解

如何判断欠拟合是因为模型选择错误还是超参数选择错误？

学好具体算法和机器学习的实际应用之间有哪些距离？

关于 XGBoost

关于机器学习不同的指标

其他算法的决策边界

在三维数据上的 PCA

关于回归和分类

热搜

最近搜索清空