老师在课中提到,AlexNet和VGG都是经过了几层卷积pooling后,最后输入到全连接层,其中每一层都是学的图像全部信息。而ResNet不同,它的残差部分只是图像的某些表达(可以说是图像的部分信息),而X里面是承载的图像的全部信息。我在这里的理解是,当网络层次更深的时候,残差部分学不到什么东西,直接将X中的内容拿来继续学习,这里的X可以视为图像信息的一种备份,不知道这样的理解对不对。然后我想问的是,ResNet它也是经过了卷积层和池化层,过程几乎和Alex、VGG一样,为什么前者就是学到图像部分信息,而后者就是学到图像的全部信息呢?