论文:Deeplab_v1

来源:互联网 发布:公务员 紧缺职位 知乎 编辑:程序博客网 时间:2024/05/16 10:29

DCNN的最后一层对物体分隔的局部信息不够清楚,即DCNN最后一层都是高等级的特征,缺少局部信息。在DCNN的最后一层加上CRF解决这一个问题。
DCNN在high-level水平上取得了很大的成就,比如image classify,object detection等。这可以部分归功于DCNN的built-in invariance,可以让网络一层一层的提取特征。
但是这样会阻碍low-level特征的提取。
DCNN应用在图像标注上的两个障碍:
信号下采样,每一层的池化和stride降采样都会降低信号的分辨率。提出atrous方法来解决
空间不变性,以目标为中心的分类器需要空间不变性,限制了空间准确率。提出CRF来解决,CRF将class scores(通过分类器)和low-level信息(通过local interaction of pixels and edges)结合起来。

在VGG-16网络的最后一层用21-way替代1000-way,损失函数是sum of cross-entropy terms of each spatial position in the CNN output map

score maps 是没有经过softmax计算的图,belief maps 是经过softmax计算的图
这里写图片描述
score maps are quite smooth,允许我们使用简单的双线性差值提高其分辨率。FCN并没有才用hole algorithm策略,所以他们的网络复杂且费时。
score maps 可以准确的预测物体及其位置,但是outline却不清晰。卷积网络中分类准确率和定位准确率是相互制约的。
Deeper model with 多层池化层在分类任务上表现的很好,但是因为他的increased invariance 和large receptive fields 导致从top output levels 推测 position 具有很大的困难。

short-range CRFs 的主要作用是清除弱分类器在top of local featrues 做的伪预测。
scores maps的图 smooth 而且产生同质化的分类结果。使用short-range CRFs可以recover detialed local structure 而不是 further smooth it.
local-range CRFs 虽然可以提高localization,但是miss thin-structrue,而且计算麻烦。

这里写图片描述
使用fully connected CRF 克服short-range 的缺点。
我们也使用了multi-scale prediction 方法来增加boundary localization accuracy ,但这些都没有fully-connnected CRF表现的好。

原创粉丝点击