paperweekly

来源：互联网发布：android批注涂鸦源码编辑：程序博客网时间：2024/06/08 03:04

Margin Sample Mining Loss: A Deep Learning Based Method for Person Re-identification

1. 文章提出了一种新的度量学习方法 Margin sample mining loss - MSML。Triplet loss 是一种非常常用的度量学习方法，Quadruplet loss 和 Triplet hard batch loss（TriHard loss）是它的两个改进版本，而 MSML 是吸收了 Quadruplet loss 和 TriHard loss 两个优点的综合体，实验证明 MSML 能够在 person ReID 的公开数据集上取得很好的结果；

2. 这个方法不止可以应用于 person ReID，而是一种通用的度量学习方法，进一步可以延伸到图像检索等相关的各个领域。

Scale-adaptive Convolutions for Scene Parsing

ICCV'17 Poster。简而言之，文章提出了一个 scale-adaptive 的 dilation conv层。

1. 与 fixed coefficient 的 dilation conv 相比，本文提出的 scale-adaptive conv 层通过前一层的 feature 对于每一个位置预测一个 variant coefficient。对于大物体，我们应该需要更大的感受野，因此得到一个大的系数；对于小物体，我们应该关注细节而忽略背景，则缩小感受野更加强调细节的 feature。可以参考文章图 3 理解；

2. dilation 系数非整数时，使用常见的 STN 中的 bilinear interpolation 做到可以 e2e 的学习；

3. 合理的初始化系数回归层的参数，并在训练时进行对其 clip，使得 dilation 系数位于一个合理的范围内；

4. 文章提到在高层使用效果较好；

5. 即插即用，较小的额外参数和计算开销。相比 baseline 不加多尺度训练的情况下可以在 cityscape 上涨 2 个多点。

阅读全文

0 0