mnist 逻辑回归不收敛-慕课网

1回答

liuyubobobo 2020-01-29 13:24:37

我使用最新的 sklearn 基于 LogisticRegression 在 MNIST 上进行了一下实验，代码如下：https://git.imooc.com/coding-169/coding-169/src/master/09-Logistic-Regression/Optional-03-MNIST-in-LogisticRegression/Optional-03-MNIST-in-LogisticRegression.ipynb

整体，看你的训练时间，近乎一定没有做 PCA。对于图像数据来说，数据冗余还是很大的，最好做一下 PCA。否则本身也会遭遇维度灾难的问题。

PCA 以后，进行标准化，然后使用 solver="newton-cg" ，我的测试结果没有收敛问题。可以尝试在你的环境下运行一下我的代码，看是不是有问题？如果没有问题，仔细比对一下，看看自己的代码问题在哪里？

继续加油！：）

0 回复有任何疑惑可以回复我~

收起回答

提问者 MrZLeo #1

尝试了PCA和归一化，之后果然顺畅多了，也可以得到跟老师一样的结果。
仔细查看了老师的代码，老师在使用logistics regression之前先对数据进行了预处理，极大地加快了计算的速度，这一点非常重要。

但是，我还有一个问题，即便没对数据进行预处理，增大的不应该只是计算时间吗？为什么会导致无法收敛这种情况发生呢？

btw，老师的代码在Standardization进行fit的时候传入了y_train，这个应该是不需要的吧？

回复有任何疑惑可以回复我~ 2020-01-29 14:40:04

liuyubobobo 回复提问者 MrZLeo #2

就是因为维度灾难啊。巨大的维度使得搜索空间巨大，对应或者搜索时间超长，或者由于搜索空间太广袤了，中间搜索步骤不知道去哪里更好，因为似乎去哪里都不够好！P.S. y_train 可以不传。

回复有任何疑惑可以回复我~ 2020-01-29 14:42:33

提问者 MrZLeo #3
```
非常感谢老师！新年快乐呀！
```
回复有任何疑惑可以回复我~ 2020-01-29 14:52:32

点开查看后面4条评论

mnist 逻辑回归不收敛

正在回答

1回答

相似问题

请选择置顶位置

本课精华内容

PCA降维的把握和依据分别是什么？比如把一个近似直线分布的二维点数据降维成直线？

关于线性回归中归一化处理和不对归一化处理的问题

数据归一化为什么有用？对归一化无法直观理解

如何判断欠拟合是因为模型选择错误还是超参数选择错误？

学好具体算法和机器学习的实际应用之间有哪些距离？

关于 XGBoost

关于机器学习不同的指标

其他算法的决策边界

在三维数据上的 PCA

关于回归和分类

热搜

最近搜索清空