深度学习: 从 RoIPooling 到 RoIAlign

来源:互联网 发布:php超市会员管理系统 编辑:程序博客网 时间:2024/06/05 17:01

RoIPooling

2015年由Ross Girshick大神在Fast R-CNN中提出。旨在满足一次性训练 feature map的前提下,替代 R-CNNwraped region 的功能。

这里写图片描述

百密一疏。由于 RoIPooling 采用的是 INTER_NEAREST(即最近邻插值) ,即在resize时,对于 缩放后坐标不能刚好为整数 的情况,采用了 粗暴的四舍五入,相当于选取离目标点最近的点。

RoIAlign

于是问题来了,Kaiming He 在他的论文Mask RCNN里宣称,这样做会在一定程度上损失 空间对称性(Alignment),所以他们把 最近邻插值 换成了 双线性插值 。换完插值法的 RoIPooling 就有了一个更加高大上的名字 —— RoIAlign

这里写图片描述

具体关于 双线性插值 的介绍可参见我的另一篇博客:图像处理: 五种 插值法。