人脸检测网络: SSH: Single Stage Headless Face Detector

最近看了一下人脸检测的论文, 除了通用的目标检测方法, 看见了这篇论文, 整体上而言和yolo-v3结构是类似的, SSH 设计了不同的检测头.

SSH 网络

SSH 网络结构如上图, 除开常规的基网络以及跨尺度的特征融合, 主要有三个检测模块, M1, M2, M3. M1 层最浅、感受野最小, 负责检测小目标. 以此类推, 包括 YOLO-v3 等多尺度检测都是这样分配.

SSH 网络检测模块结构如上, 由 3 * 3 卷积与上下文模块并行, 然后concat, 然后分别进行分类与坐标回归. 坐标回归与RPN一样, 每个位置预设 K 个anchor.

SSH 上下文模块如上图所示, 使用 3 * 3 卷积序列来替代 5 * 5, 7 * 7 卷积核, 获得更大的感受野同时减低参数.

ref

ssh paper