收藏

深度学习之目标检测常用算法原理+实践精讲

YOLO / Faster RCNN / SSD / 文本检测 / 多任务网络

深度学习之目标检测常用算法原理+实践精讲

难度 高级 时长 19小时 学习人数 673 综合评分 10.00

深度学习之目标检测常用算法原理+实践精讲

  • 第1章 课程介绍 试看 1 节 | 23分钟

    本章节主要介绍课程的主要内容、核心知识点、课程涉及到的应用案例、深度学习算法设计通用流程、适应人群、学习本门课程的前置条件、学习后达到的效果等,帮助大家从整体上了解本门课程的整体脉络。

    收起列表

    • 视频: 1-1 课程导学 (22:58) 试看
  • 第2章 目标检测算法基础介绍 13 节 | 122分钟

    本章节主要介绍目标检测算法的基本概念、传统的目标检测算法、目前深度学习目标检测主流方法(one-stage、two-stage、多任务网络)、相关算法的基本流程、算法性能的评价指标、不同算法的优缺点和性能比较等,并结合实际的应用场景和案例来介绍目标检测算法的重要性和实用性。...

    收起列表

    • 视频: 2-1 目标检测问题定义 (12:10)
    • 视频: 2-2 目标检测问题方法 (15:11)
    • 视频: 2-3 传统目标检测方法基本流程 (05:33)
    • 视频: 2-4 常见传统目标检测方法-Viola-Jones(人脸检测) (08:58)
    • 视频: 2-5 常见传统目标检测方法-HOG+SVM(行人检测、Opencv) (09:21)
    • 视频: 2-6 常见传统目标检测方法-DPM(物体检测) (06:34)
    • 视频: 2-7 常见传统目标检测方法-Sofe-NMS(非极大值抑制算法) (05:54)
    • 视频: 2-8 Two-stage基本介绍,流程与常见算法 (08:25)
    • 视频: 2-9 Two-stage核心组件 (21:06)
    • 视频: 2-10 One-stage基本介绍、流程与常见算法 (04:36)
    • 视频: 2-11 One-stage核心组件 (18:52)
    • 视频: 2-12 One-stage与Two-stage优缺点对比 (05:14)
    • 作业: 2-13 【讨论题】如何理解目标检测中的度量指标?
  • 第3章 SSD系列算法原理精讲 试看 5 节 | 55分钟

    本章节主要针对SSD系列目标检测算法原理进行介绍,其中涉及到了one-stage目标检测算法流程,SSD及其变种网络(DSSD、DSOD、FSSD、RSSD等)的核心思想、主干网络设计思想、框架结构、Default box、Prior box、样本构造、数据增强、损失函数,对比不同算法优缺点以及介绍算法应用场景等。...

    收起列表

    • 视频: 3-1 SSD系列算法介绍(主干网络、多尺度Feature Map预测) (12:18) 试看
    • 视频: 3-2 Prior Box Layer、样本构造、损失函数介绍 (19:34)
    • 视频: 3-3 DSSD、DSOD算法 (13:29)
    • 视频: 3-4 FSSD、RSSD算法 (09:29)
    • 图文: 3-5 思考题
  • 第4章 基于SSD的人脸检测项目实战 试看 12 节 | 150分钟

    本章节以人脸检测实际业务场景为例,利用SSD来解决人脸检测问题,涉及到了Wider Face数据集介绍、VOC数据集格式、打包、SSD框架解读、环境搭建、SSD-Face人脸检测模型训练、测试等内容,帮助大家从实际案例的角度出发,快速入门SSD算法框架的实战项目。...

    收起列表

    • 视频: 4-1 人脸业务场景介绍(常见问题、标注方法、算法性能好坏、人脸采集常用方法) (20:54)
    • 视频: 4-2 Wider Face数据集介绍、标注格式、下载等 (15:01)
    • 视频: 4-3 Wider Face数据集介绍 (06:36)
    • 视频: 4-4 Wider Face数据集转VOC格式数据集编程实现 (24:29)
    • 视频: 4-5 使用Caffe-SSD打包Wider Face为LMDB格式样本实操 (06:01)
    • 视频: 4-6 Caffe-SSD框架搭建及训练脚本解读 (15:45)
    • 视频: 4-7 Caffe-SSD人脸检测模型训练实操讲解 (11:19)
    • 视频: 4-8 Caffe-SSD框架主干网络脚本讲解+实操 (08:58)
    • 视频: 4-9 Caffe-SSD框架训练脚本讲解+实操 (13:47)
    • 视频: 4-10 Caffe-SSD框架模型测试介绍与脚本编程实现 (15:31)
    • 视频: 4-11 Caffe-SSD框架测试结果可视化与人脸检测技巧说明 (11:09) 试看
    • 图文: 4-12 思考题
  • 第5章 Faster RCNN系列算法原理精讲 8 节 | 89分钟

    本章节主要针对Faster RCNN系列目标检测算法原理进行介绍,其中涉及到了two-stage目标检测算法流程、从RCNN到Faster RCNN以及Faster RCNN的系列变种网络(HyperNet、RFCN、Light-Head RCNN、Mask-RCNN、Cascade RCNN、CoupleNet)的核心思想、主干网络设计思想、框架结构、RPN网络、OHEM、Soft-NMS等,对比不同算法优...

    收起列表

    • 视频: 5-1 Faseter-Rcnn系列介绍 (06:38)
    • 视频: 5-2 RCNN介绍 (14:19)
    • 视频: 5-3 SPPNet介绍 (10:23)
    • 视频: 5-4 Fast rcnn介绍 (21:02)
    • 视频: 5-5 HyperNet、RFCN介绍 (12:47)
    • 视频: 5-6 Light-Head RCNN、Mask-RCNN介绍 (10:35)
    • 视频: 5-7 Cascade RCNN、CoupleNet、OHEM、Soft-NMS介绍 (13:00)
    • 图文: 5-8 思考题
  • 第6章 基于Faster RCNN的ADAS场景目标检测项目实战 13 节 | 138分钟

    本章节以ADAS实际业务场景为例,利用Faster RCNN来解决机动车、非机动车、行人等驾驶场景中的目标检测问题,涉及到Kitti数据集介绍、VOC格式数据转换、Faster rcnn框架解读、环境搭建、Faster rcnn-ADAS目标检测模型训练、测试等内容,帮助大家从实战的角度快速掌握Faster RCNN系列算法框架的使用。...

    收起列表

    • 视频: 6-1 ADAS业务场景介绍 (15:04)
    • 视频: 6-2 Kitti数据集介绍、标注格式、下载等 (10:22)
    • 视频: 6-3 Kitti数据集类别提取编程实现 (14:13)
    • 视频: 6-4 Kitti数据集转VOC格式数据脚本编程实现 (16:13)
    • 视频: 6-5 Faster RCNN目标检测模型环境搭建介绍 (10:51)
    • 视频: 6-6 Faster RCNN目标检测环境搭建实操 (05:34)
    • 视频: 6-7 Faster RCNN目标检测框架介绍 (09:10)
    • 视频: 6-8 Faster RCNN目标检测框架训练脚本参数配置介绍 (14:38)
    • 视频: 6-9 Faster RCNN目标检测框架配置修改实操 (14:47)
    • 视频: 6-10 Faster RCNN目标检测模型训练及其优化 (06:58)
    • 视频: 6-11 利用Faster RCNN测试脚本进行模型测试 (06:25)
    • 视频: 6-12 自己动手编程实现Faster RCNN模型测试脚本 (13:19)
    • 图文: 6-13 思考题
  • 第7章 YOLO系列算法原理精讲 6 节 | 62分钟

    本章节主要针对YOLO系列目标检测算法原理进行介绍,其中涉及到了算法基本流程、主干网络结构、设计思路、YOLOV1/V2/V3/9000、Anchor Boxes、Multi-Scale Training、Darknet-19网络、Darknet框架等,对比不同算法优缺点和模型性能等。

    收起列表

    • 视频: 7-1 Yolov1算法 (21:28)
    • 视频: 7-2 Yolov2算法(1) (12:38)
    • 视频: 7-3 Yolov2算法(2) (11:42)
    • 视频: 7-4 Yolo9000算法 (05:12)
    • 视频: 7-5 Yolov3算法 (10:44)
    • 图文: 7-6 思考题
  • 第8章 基于YOLOV3的通用物体检测项目实战 7 节 | 88分钟

    本章节以通用物体检测(coco)实际业务场景为例,利用YOLOV3来解决通用物体检测问题,涉及到coco数据集介绍、darknet框架解读,环境搭建、YOLOV3-coco通用物体检测模型训练、测试等内容,帮助大家了解理论的前提下,快速入门YOLO系列算法实战项目。...

    收起列表

    • 视频: 8-1 物体检测业务场景综述 (17:53)
    • 视频: 8-2 COCO数据集介绍、标注格式、下载脚本等 (09:46)
    • 视频: 8-3 YOLOV3DarkNet框架介绍和环境搭建 (13:54)
    • 视频: 8-4 DarkNet框架解读及相关配置说明 (18:06)
    • 视频: 8-5 利用DarkNet框架进行YOLOV3模型训练实操 (15:08)
    • 视频: 8-6 YoloV3检测模型的测试介绍及编程实例 (12:15)
    • 图文: 8-7 思考题
  • 第9章 文本检测系列算法原理精讲 13 节 | 190分钟

    本章节主要针对文本检测系列算法原理进行介绍,其中涉及到了算法基本流程、传统的文本检测算法(Top-down、bottom-up)、物体检测算法VS文本检测算法、文本检测算法优化方向、常用文本检测算法模型(CTPN、RRPN、FTSN、DMPNet、EAST、SegLink、Pixel Link、Textboxes、Textboxes++等)、文本检测数据集(ICDAR、CTW、RCTW-...

    收起列表

    • 视频: 9-1 文本检测算法原理介绍 (12:50)
    • 视频: 9-2 CTPN模型 (10:38)
    • 视频: 9-3 RRPN模型 (19:11)
    • 视频: 9-4 FTSN模型 (11:41)
    • 视频: 9-5 DMPNet模型 (15:56)
    • 视频: 9-6 EAST模型 (09:17)
    • 视频: 9-7 SegLink模型 (13:01)
    • 视频: 9-8 PixelLink模型 (16:35)
    • 视频: 9-9 Textboxes讲解 (18:41)
    • 视频: 9-10 Textboxes++模型介绍 (25:34)
    • 视频: 9-11 文本检测常见数据集 (21:16)
    • 视频: 9-12 其他检测模型方法介绍 (14:56)
    • 作业: 9-13 【讨论题】如何理解基于分割的文字检测算法
  • 第10章 基于EAST的自然场景文本检测项目实战 6 节 | 62分钟

    本章节以自然场景下的文本检测实际业务场景为例,利用EAST框架来解决文本检测问题,涉及到ICDAR数据集介绍、ICDAR数据下载、标注格式解读、EAST框架解读、环境搭建、模型训练、测试等,帮助大家从实际案例的角度出发,快速入门文本检测算法框架的实战项目。...

    收起列表

    • 视频: 10-1 自然场景下文本检测业务场景综述 (15:26)
    • 视频: 10-2 ICDAR数据集介绍、标注格式、下载等 (11:00)
    • 视频: 10-3 EAST文本检测框架环境搭建 (09:03)
    • 视频: 10-4 EAST文本检测框架解读与训练实操 (16:23)
    • 视频: 10-5 EAST文本检测模型测试脚本编程实例 (09:26)
    • 作业: 10-6 【讨论题】如何理解倾斜物体检测,与通用目标检测的区别?
  • 第11章 多任务网络原理介绍 4 节 | 19分钟

    本章节主要针对文本检测系列算法原理进行介绍,其中涉及到了算法基本流程、传统的文本检测算法(Top-down、bottom-up)、物体检测算法VS文本检测算法、文本检测算法优化方向、常用文本检测算法模型(CTPN、RRPN、FTSN、DMPNet、EAST、SegLink、Pixel Link、Textboxes、Textboxes++等)、文本检测数据集(ICDAR、CTW、RCTW-...

    收起列表

    • 视频: 11-1 多任务网络业务场景综述 (07:49)
    • 视频: 11-2 人脸检测+关键点多任务网络模型MTCNN介绍 (05:16)
    • 视频: 11-3 人脸检测+关键点多任务网络数据集介绍 (05:30)
    • 图文: 11-4 思考题
  • 第12章 基于人脸检测+关键点定位的多任务网络项目实战 7 节 | 76分钟

    本章节以人脸检测+关键点定位的实际业务场景为例,利用MTCNN多任务网络来解决多个任务的数据打包、环境搭建、模型训练、测试等实战项目,帮助大家从实际案例的角度出发,快速入门多任务网络的实战项目。

    收起列表

    • 视频: 12-1 MTCNN环境配置、框架解读、数据打包 (18:41)
    • 视频: 12-2 MTCNN数据打包(PNet、RNet、ONet)实操(1) (14:57)
    • 视频: 12-3 MTCNN数据打包(PNet、RNet、ONet)实操(2) (13:45)
    • 视频: 12-4 MTCNN模型训练介绍 (03:33)
    • 视频: 12-5 MTCNN模型训练(PNet、RNet、ONet)实操 (15:50)
    • 视频: 12-6 MTCNN模型(PNet、RNet、ONet)测试实操 (09:01)
    • 图文: 12-7 思考题
  • 第13章 课程总结 11 节 | 123分钟

    针对课程进行最后总结,回顾课程核心内容,分享目标检测行业实战经验,再次帮助大家理清学习内容进一步的给出后续学习和提升给出建设性意见。

    收起列表

    • 视频: 13-1 one-stage vs two-stage (13:13)
    • 视频: 13-2 不同目标检测算法的优缺点对比 (12:52)
    • 作业: 13-3 【讨论题】如何理解Anchor-free的技术方案?
    • 视频: 13-4 不同目标检测算法的精度对比 (10:42)
    • 作业: 13-5 【讨论题】深入探讨目标检测问题和相关优化技巧
    • 视频: 13-6 常见目标检测研究对象与数据集 (10:37)
    • 视频: 13-7 目标检测常见任务与性能评价指标 (18:23)
    • 视频: 13-8 目标检测行业应用现状-人脸检测 (17:31)
    • 视频: 13-9 目标检测行业应用现状-ADAS (10:20)
    • 视频: 13-10 目标检测行业应用现状-文本检测 (09:05)
    • 视频: 13-11 课程总结 (19:30)
本课程已完结

试看

全部试看小节



讲师

会写代码的好... 算法工程师

同济大学计算机专业硕士,曾先后就职于香港理工大学RA、海康威视研究院担任计算机视觉方向算法工程师,目前就职于创业公司任首席科学家,负责公司AI产品中系列图像算法研发。曾发表多篇SCI、EI学术论文,申请多项国家专利,参与多项图像、自然语言项目相关课题研发工作,在计算机视觉领域具有深厚的专业知识和工程开发经验。

课程预览

检测到您还没有关注慕课网服务号,无法接收课程更新通知。请扫描二维码即可绑定
重新观看
意见反馈 帮助中心 APP下载
官方微信

学习咨询

选课、学习遇到问题?

扫码添加指导老师 1V1 帮助你!

添加后老师会第一时间解决你的问题