采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
用ssd算法检测行人和车辆,采用了kitti数据集进行模型训练。没有采用预训练模型,主干网络也去掉了两层,迭代了几十万次,loss再也降不下去。训练出来的模型只能检测出车辆,无法检测出行人,并且还有时将行人,自行车检测为车辆。各种调参均无效,如何解决呢?我在想会不会是样本不均衡,感觉kitti数据集的行人数量相比车辆还是太少。但是采用ssd_vgg_300预训练模型进行训练效果是好的,这是为什么呢?
首先,网络是否会收敛基本上应该在训练几万次的时候就能够看出来了。十几万次如果还不收敛那大概率是网络结构的问题(除去样本错误)。需要提醒的一点是,主干网络的结构在进行调整过之后,很有可能会导致结果不好,在使用SSD模型的时候,一定要注意输入给detection层的feature map尽量保证是卷积之后的结果,在relu和BN之前。网络结构如果本身有问题,调整参数是没有太大帮助的。在使用SSD_VGG原始模型进行训练的时候,不加预训练是够能够正常收敛?
在使用SSD_VGG原始模型进行训练的时候,不加预训练也不能够正常收敛(看的是几万次的训练结果),会不会是数据的问题呢?
登录后可查看更多问答,登录/注册
从原理到场景实战,掌握目标检测核心技术
2.1k 9
980 7
575 5
2.3k 4
1.9k 4