bobo老师您好,最近在看您机器学习的同时也在阅读Dive into Deep Learning。我看到deep learning讲解线性回归时候又提及一种softmax回归问题,我以前以为softmax回归就是多元线性回归,现在发现是这是错误的理解,但是还是不太懂他们直接具体区别。bobo老师我自己粗浅的理解是,softmax回归不是线性的,是离散的。而多元线性回归还是线性问题?
请bobo老师能不能有更加直白的解释。谢谢老师
谢谢老师,bobo这回复信息量有点大,因为我有点心急,导致后面的逻辑回归没有看就来问您这个问题,可能之后看到逻辑回归部分问题就解决了。另外一个问题就是我应该是看孰不太仔细,下面我放一张dive into deep learning的三段原话。因为这个回复好像不能放图片了。
前几节介绍的线性回归模型适用于输出为连续值的情景。在另一类情景中,模型输出可以是一个像图像类别这样的离散值。对于这样的离散值预测问题,我们可以使用诸如softmax回归在内的分类模型。和线性回归不同,softmax回归的输出单元从一个变成了多个,且引入了softmax运算使输出更适合离散值的预测和训练。本节以softmax回归模型为例,介绍神经网络中的分类模型。
让我们考虑一个简单的图像分类问题,其输入图像的高和宽均为2像素,且色彩为灰度。这样每个像素值都可以用一个标量表示。我们将图像中的4像素分别记为\(x_1, x_2, x_3, x_4\)。假设训练数据集中图像的真实标签为狗、猫或鸡(假设可以用4像素表示出这3种动物),这些标签分别对应离散值\(y_1, y_2, y_3\)。
我们通常使用离散的数值来表示类别,例如\(y_1=1, y_2=2, y_3=3\)。如此,一张图像的标签为1、2和3这3个数值中的一个。虽然我们仍然可以使用回归模型来进行建模,并将预测值就近定点化到1、2和3这3个离散值之一,但这种连续值到离散值的转化通常会影响到分类质量。因此我们一般使用更加适合离散值输出的模型来解决分类问题。
以上就是dive into deep learning原话,但确实softmax回归是处理图像这种分类问题的,可能这段中多次出现离散词影响了我。