几篇论文

来源：互联网发布：矢量图软件手机版编辑：程序博客网时间：2024/06/05 09:04

来自微信公众号paperweekly，里面集中在文本方向。

1.Learning to Rank Short Text Pairs with Convolutional Deep Neural Networks

这是一篇相当经典的 Siamese 网络模型，类似架构可以通过改变左右两边的网络结构而适用于各种 task。

如果把右侧网络输入换成 Label，则可以用于实现http://yann.lecun.com/exdb/publis/pdf/lecun-06.pdf.

2.Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields

CVPR 2017：多人姿态实时估计，这里主要亮点还是多人实时+效果.本文算法主要流程如下：输入一幅图像，经过卷积网络提取特征，得到一组特征图，然后分成两个岔路，分别使用 CNN 网络提取 Part Confidence Maps 和 Part Affinity Fields ，得到这两个信息后，我们使用图论中的 Bipartite Matching 将同一个人的关节点连接起来得到最终的结果。

3.In Defense of the Triplet Loss for Person Re-Identification

对 triplet loss 的一个讨论，里面的 batch hardmining 非常好用。

Adversarial Representation Learning for Domain Adaptation

ARDA 将 classifier、encoder 以及 discriminator 三者共同训练，思路不错

https://github.com/corenel/pytorch-arda

Unsupervised Image-to-Image Translation Networks

The proposed framework can learn the translation function without any corresponding images in two domains.

https://github.com/leehomyc/Img2Img-Translation-Networks

A Discriminatively Learned CNN Embedding for Person Re-identification

在行人识别领域有两类流型的模型（都是基于 CNN），一类是 verification model，一类是 identification model，由于损失函数不同，两类模型各有优缺点。

verification model 以图片对作为输入，经过一个非线性函数（CNN），得到特征后进行相似度判断，这样只利用到了弱的 Re-id 标签。identification model 训练时是以一张图片作为输入，经过一个非线性函数（CNN），得到特征，然后进行多类判断。

在测试阶段，把两张图片经过全连接的网络，得到特征，然后再做相似度判断。identification model 虽然利用了更多的标注信息，但是训练的目标并不直接是行人重识别。

本文的创新之处，是结合两类模型，学习一个更有区分度的行人识别判别器。实验效果表明，本文提出的融合模型，在 Market1501 和 CUHK 数据集都比基础的两类模型有效果提升，并且该模型还可以运用在图片检索领域。

https://github.com/D-X-Y/caffe-reid

阅读全文

0 0