Deep Learning based Large Scale Visual Recommendation and Search for E-Commerce

来源:互联网 发布:厦门大学网络教育本科 编辑:程序博客网 时间:2024/06/06 01:36

一篇用于相似物品的图片推荐的paper,github地址
网络结构如下所示
Deep Ranking CNN Architecture

图a展示的是整体的框架,每个VisNet具体细节如图b所示。
VisNet是具有两个分支:一个传统 的VGG16和一个浅层网络(kernel size 较大)
VGG16用于提取 high level/ abstract details
浅层网络用于提取 low level/fine-graind details

triplet loss也用于此。
(q,p,n)
a query image (q), a positive image (p) and a negative image (n)
The in-class triplets 让网络学会细微的差异,The out-of-class triplets让网络学会coarse-grained 差别。

测试的时候,是对每张图片直接提取图b中最后输出的feature vector,之后再用距离度量方式度量差异性。

0 0
原创粉丝点击