采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
老师好,蓝色标注这里。为什么这里要让卷积层得到填充,即channel 从96变成256。另外我看到这里的滤波器是 5*5,步长为1。请问从96到256,是如何设计这个滤波器的大小及步长的?
同学你好,首先我们应该明确填充技术的意义:减少边缘信息丢失,让其在特征提取过程中发挥更大的作用,如果我们一直不进行填充操作,那随着对图像多次进行卷积操作,边缘信息将大部分被丢失掉。目前随着图像技术的发展,很多新模型都会考虑把填充技术应用到更前面,比如后面的vgg16,在第一次卷积运算就进行了填充。当然,这并不是必须的,可以理解为实践中发现作用其实是挺不错的。
关于滤波器和步长设置的问题,其实并没有说哪一个组合一定是最好的,但我们通常要做一些平衡:比如步长小,那可以尽可能提取更多信息,但是会导致运算速度变慢;滤波器大小则是可能根据想要提取特征的不同进行调整。考虑到这些数字很难说有一个最优的数值,那我们其实可以考虑在整个模型的设计中尝试都是3*3或者4*4或者5*5,然后比较效果,根据效果再去分析为什么这种组合可以达到更好的效果,这也是很多学者尝试做的事情,对于大部分应用者来说,我们可以先参考前人已经提取出的模型,这样可以很大程度上减低自己的开发难度,并且得到较好的效果。这也是为什么flare老师在这里专门和大家介绍了几个经典的CNN模型,其实现在有一些新模型比如mobilenet、resnet,感兴趣的话也可以了解一下。
登录后可查看更多问答,登录/注册
人工智能基础全方位讲解,构建完整人工智能知识体系,带你入门AI
1.2k 5
4.0k 3
1.5k 1
2.3k 3
1.1k 11