逻辑回归算法提示算法不收敛-慕课网

1回答

liuyubobobo 2021-12-18 01:04:31

数据量大概多大？

==========

如果你有 5 个特征，degree = 5，就意味着有 5^5 = 3125 个特征了。这个特征量就已经远远大于你现在的数据量了。而如果 degree = 10，就生成了 9765625 个特征，这个特征量太大了，妥妥的维度灾难。（3125 个特征已经肯定维数灾难了。）

要想获得较好的结果，在大多数情况下，至少数据量要大于特征量，最好的情况下，数据量应该是特征量的 10 倍乃至 100 倍以上。（对比你说获得比较好的效果，degree = 2，就是有 25 个特征，1400 的数据量是 25 的 56 倍左右。）

如果你想要使用多项式特征，就要增大数据量。增大到什么地步？请参考上面我计算出的特征数。

从这些数据，你也可以看出来，实际上在大多数时候，多项式特征都不是一个好的特征工程方式。即使使用，degree = 3 撑死了。（对于诸如图像数据这种高维数据，连 degree = 2 都没有用。）多项式特征是一个极好的介绍“过拟合”概念的方式（所以这个课程在介绍完多项式特征以后，马上介绍过拟合。）但它不是一个好的特征工程方式。

继续加油！：）

0 回复有任何疑惑可以回复我~

收起回答

提问者 luluoverflow #1

1400条，我使用网格搜索，C=3800，degree=2的时候准确率最高，在百分之58左右，但是需要把max_iter设置为10000算法才能收敛。。。耗时特别长，是数据量太大了吗

回复有任何疑惑可以回复我~ 2021-12-18 09:53:47

提问者 luluoverflow #2

老师我刚刚设置成OvO分类，max_iter设置为10000，使用网格搜索C=[3000, 3200, 3400, 3500, 3600, 3800, 4000]， degree=[1, 2]，最后搜索的最优C=3800，degree=2，平均准确率提高到了67，不过当我把degree范围扩大到[1. 2. 3. ]，就偶尔会（运行10次警3次）警告线性算法没有收敛（warn('The line search algorithm did not converge', LineSearchWarning)，是不是不能再尝试更大的degree值了，还有别的办法吗?

回复有任何疑惑可以回复我~ 2021-12-18 10:24:18

提问者 luluoverflow #3

另外老师，l1正则化和OvO分类都有各自的solver要求，那如果想同时使用，solver应该设置成什么呢

回复有任何疑惑可以回复我~ 2021-12-18 10:39:16

点开查看后面4条评论

逻辑回归算法提示算法不收敛

正在回答回答被采纳积分+3

1回答

相似问题

请选择置顶位置

本课精华内容

PCA降维的把握和依据分别是什么？比如把一个近似直线分布的二维点数据降维成直线？

关于线性回归中归一化处理和不对归一化处理的问题

数据归一化为什么有用？对归一化无法直观理解

如何判断欠拟合是因为模型选择错误还是超参数选择错误？

学好具体算法和机器学习的实际应用之间有哪些距离？

关于 XGBoost

关于机器学习不同的指标

其他算法的决策边界

在三维数据上的 PCA

关于回归和分类

热搜

最近搜索清空