请稍等 ...
×

采纳答案成功!

向帮助你的同学说点啥吧!感谢那些助人为乐的人

老师,那个请问在python中图片通道信息是如何存储的?

正在回答

1回答

在python版的cifar数据集里,每张图片都是一个长度为3072的一个向量。然后这个向量的前1024个数字是图像的R通道,中间1024个数字是图像的G通道,最后1024个数字是图像的B通道。

所以reshape(3, 32, 32)里的第一步操作就是将这个3072的向量平均分为3份,每份是1024个数字。这样通道就切分出来了

对于每个1024个数字,它包含了图像的一个通道的信息。这里图像的一个通道是32*32的矩阵。展开就是1024个数字。矩阵的展开方法就是将所有行拼接到一起。 比如一个3*3矩阵[[1,2,3],[4,5,6],[7,8,9]],展开就是[1,2,3,4,5,6,7,8,9]。32*32的矩阵的展开方法也是一样的。

所以reshape(3,32,32)的第二步操作就是将每个1024的长度均分成32份,然后再纵向合并,形成一个矩阵。就是[1,2,3,4,5,6,7,8,9]到[[1,2,3],[4,5,6],[7,8,9]]的逆操作。

4 回复 有任何疑惑可以回复我~
  • 提问者 风桐 #1
    谢谢老师,我知道了!
    回复 有任何疑惑可以回复我~ 2018-09-14 15:17:57
问题已解决,确定采纳
还有疑问,暂不采纳
意见反馈 帮助中心 APP下载
官方微信