场景解析--Scene Parsing through ADE20K Dataset

来源:互联网 发布:iphone闪存检测软件 编辑:程序博客网 时间:2024/05/29 07:07

Scene Parsing through ADE20K Dataset
CVPR2017
https://github.com/CSAILVision/sceneparsing
http://sceneparsing.csail.mit.edu/

MIT 搞的一个 场景解析数据库 ADE20K,可以在这上面测测自己算法的效果。
在这个数据库上我们跑了一些分割模型,在此基础上我们提出了一个 Cascade Segmentation Module,提升分割效果。

首先来看看 ADE20K 这个数据库。为什么搞了一个新数据库了?场景的种类更丰富,标记内容更详细
covering a wide range of scenes and object categories with dense and detailed annotations for scene parsing

这里写图片描述

人工标记的一致性问题:
这里写图片描述
这里写图片描述

几个主流语义分割数据库的对比:
这里写图片描述

Dataset statistics:
这里写图片描述
这里写图片描述

3 Cascade Segmentation Module
handle the long-tail distribution of objects in scenes and the spatial layout relations of scenes, objects, and object parts

本文根据分析数据库的长尾分布,提出使用 Cascade Segmentation Module 可以更好的提升分割效果
模型网络结构图:
这里写图片描述

方法效果对比:
这里写图片描述

这里写图片描述

在语义分割中引入 Cascade 还是很好的。