语义分割之: FCN

2020-04-10

研究生阶段自己对分割这边还是很熟悉的, 工作后发现很多网络只能说出原理和整体框架, 面试时问的很细节, 再次将经典分割网络仔细review一遍.

主要创新点

全卷积网络由分类到语义分割
转置卷积实现上采样
跳跃连接，跨层特征融合

从图像分类到语义分割

图像分类, 对于输入图片经过卷积池化后连接全连接层得到一个一维的类别预测向量. 向量的每个位置代表对某一个类别的响应. 考虑使用 1 * 1 卷积代替全连接层并将卷积核设置为类别数, 网络输出便可训练为每个位置属于每个类别的概率. 由于网络中具有池化操作, 得到的feature map相对于输入缩小了, 需要通过上采样进行空间分辨率恢复.

转置卷积实现上采样

对于普通卷积, 当步长大于1时, 会对图像进行下采样. 转置卷积则是对输入特征进行上采样, 转置卷积过程如下图, 通过先对输入进行填充, 再卷积, 将输出 2 * 2 上采样为 5 * 5. 也叫作分数步卷积, 是对特征图进行扩充, 假如扩张率（dilation）是2, 即意味着在特征图每两个相邻的像素间插入一个值(一般是插0)