Default Box

SSD中的Default Box在其尺度遵循公式 $S_k=S_{min}+\frac{S_{max}-S_{min}}{m-1}(k-1)$ ,其中 $m$ 表示所使用的特征图的数量， $S_k$ 表示由浅而深的第 $k$ 张特征图上的Default Box的尺度， $S_{min}$ 是最浅层的尺度，为 $0.2$ ， $S_{max}$ 是最深层的尺度，为 $0.9$ 。
对于每一层特征图，SSD设4~6个Default Box，其横纵比 $\alpha_r$ 分别为 $\{1, 2, 3, \frac{1}{2}, \frac{1}{3}\}$ ，所以对于每一个Default Box，其宽为 $w_k^\alpha=S_k\sqrt{\alpha_r}$ ，其高为 $h_k^\alpha=\frac{S_k}{\sqrt{\alpha_r}}$ ，当横纵比为1时，增加一个尺度的Default Box，其尺度为 $S_k^{'}=\sqrt{S_kS_{k+1}}$ 。
在每一层特征图中， $w_k^\alpha$ 和 $h_k^\alpha$ 的值与图像的输入大小的乘积代表了Default Box的实际大小，这样的小特征图可以用来检验大目标，大特征图可以用来检验小目标。
每一个Default Box应预测出一个BBox，包括其位置尺寸和类别置信度，对于SSD300，其输出是一个 $38\times38\times4+19\times19\times6+10\times10\times6+5\times5\times6+3\times3\times4+1\times1\times4=8732$ 个长度为 $(4+classes)$ 的向量。

目标检测

目标检测的基本任务

目标检测的代表技术

目标检测的评价指标

基于深度学习的方法面临的两个关键问题

R-CNN（2014）

定位问题的解决方法

选择性搜索

数据集规模小的解决方案

R-CNN的模型效果

R-CNN的不足

SPPNet(2014)

SPPNet的主要改进

Spatial Pyramid Pooling Layer

Fast R-CNN（2015）

Fast R-CNN的改进

Faster R-CNN（2016）

Faster R-CNN的网络结构

RPN网络

Anchor与坐标变换关系

非极大值抑制（Non-Maximum Suppression，NMS）

Mask R-CNN（2017）

Mask R-CNN的改进

RoIAlign

Mask分支

Two-Stage网络总结

Two-Stage网络总结

YOLO（2016）

YOLO的整体思路

YOLO的网络结构

YOLO中卷积网络的输出

YOLO中卷积网络的输出

YOLO的损失函数

YOLO的损失函数

YOLO中的非极大值抑制

YOLO模型的优缺点

SSD（2016）

SSD的改进

Default Box

SSD的训练机制

YOLO v2/YOLO 9000（2017）

YOLO v2的改进

Batch Normalization

Darknet-19

高分辨率 & 多尺度训练

Anchor

先验框聚类

直接定位预测

Passthrough Layer

YOLO9000

YOLO v3（2018）

YOLO v3的改进

YOLO v3的网络结构

多尺度目标检测