【论文笔记】SphereFace: Deep Hypersphere Embedding for Face Recognition

来源:互联网 发布:淘宝新版怎样发布宝贝 编辑:程序博客网 时间:2024/06/06 01:13

参考文献: Liu W, Wen Y, Yu Z, et al. SphereFace: Deep Hypersphere Embedding for Face Recognition[J]. arXiv preprint arXiv:1704.08063, 2017.

摘要

之前写过一篇large-marin softmax (L-Softmax) 的介绍,与Softmax Loss 相比,它能够学习区分度更高的特征。基于L-Softmax的改进,这篇paper提出Angular-Softmax(A-Softmax)去学习判别特征,它在超球面流形上强加了一个判别约束,而这个超球面流形本质上与人脸的先验知识位于同一个流形上。A-Softmax在人脸数据库LFW/YTF/MegaFace上的识别结果均优化其它loss函数。与L-Softmax类似,angular margin 同样可以由一个参数 m 来调整。

算法源码

算法介绍

1. Softmax Loss

在介绍A-Softmax之前,我们先来回顾softmax loss。当定义第 i 个输入特征 xi 以及它的标签 yi时,softmax loss 记为:

L=1NiLi=1Nilog(efyijefj)

其中 fj 表示最终全连接层的类别输出向量 f 的第 j 个元素, N 为训练样本的个数。由于 f 是全连接层的激活函数 W 的输出,所以 fyi 可以表示为 fyi=WTyixi+byi, 最终的损失函数又可以写为:
Li=log(eWyixicos(θyi,i)+byijeWjxicos(θj,i)+bj)

其中 θ(j,i0θj,iπ)是Wjxi之间的夹角。 当Wj=1bj=0 时,我们可以得到一个修改的softmax loss:
Lmodified=log(exicos(θyi,i)jexicos(θj,i))

PS: 与L-Softmax不同的是,作者除了假设bj=0,还将Wj设为1。

2. 引入Angular margin

为了便于说明,作者以二分类作为示例。为了将属于类1特征x正确分类,修改后的softmax损失函数要求cos(θ1)>cos(θ2),即θ1<θ2。本文在此基础上增加一个参数m(m2),此时要正确分类,需使cos(mθ1)>cos(θ2),即θ1<θ2/mθ2<θ1/m。这样就增强了判决的约束,使得学习出的特征的区分更强。根据这种思想修改的softmax loss函数为:

Lang=log(exicos(mθyi,i)exicos(mθyi,i)+jyiexicos(θj,i))

其中0θyi,iπm。与L-Softmax论文中相同,为了保证上式能在CNN中进行前/后向反馈,上式变换为:
Lang=log(exiψ(θyi,i)exiψ(θyi,i)+jyiexicos(θj,i))

在这里,ψ(θ) 可以表示为:
ψ(θ)=(1)kcos(mθ)2k,

其中θ[kπm,(k+1)πm]k 是一个整数且 k[0,m1]

我们可以看出,m的值越大,angular magin也就越大,那么m的最小值是多少呢?作者证明了,要使最小的类间距大于最大的类内距,对于二分类问题,需m2+3,对于多分类问题,m3。在实验中,m通常设为4。

下表为不同的Loss函数的决策边界对比:

这里写图片描述

直观分析

为了分析A-Softmax Loss的有效性,作者将初始的Softmax,修改后的Softmax以及A-Softmax在二分类的结果首先用一个简单的二维空间几何表示:

这里写图片描述

可以看到,与前两者相比,A-Softmax在类别的角度维度上的分类更加分明,决策边界明显扩大。同时,从图中我们也可以看出,Softmax 在内在的角度分布特性,这也是作者提到基于Euclidean margin和Softmax融合不能取得较好效果的原因。

各个Loss函数在2D、3D超球面流形的表示如下图所示,对于更高维度的超球面,不好描述,但大家可以脑补下。
这里写图片描述

实验结果

为了证明A-Softmax的有效性, 作者构建了Sphere Face的网络,实验在人脸识别数据上进行。训练集采用CASIA-WebFace,测试集分别在LFW/YTF上进行。

m的影响

可以看出,随着m的增大,特征的类别的区分性也就越高。(普遍反应这个图画得非常好,值得学习)
这里写图片描述

人脸识别测试

在LFW/YTF上,A-Softmax均得了最好好的结果,只比FaceNet略差(采用了更多的训练集);在MegaFace的数据集上的1:1开集比对和开集1:N搜索,Sphere Face均取得了最佳的结果。
LFW/YTF测试结果

MegaFace测试结果

总结

本文通过增加angular margin的约束,在Softmax的基础上提出了A-Softmax,以此来学习区分力更强的人脸特征Sphereface,并且证明了增强参数m的下界。各个人脸识别测试集的实验证明了该方法的有效性。

阅读全文
'); })();
0 0
原创粉丝点击
热门IT博客
热门问题 老师的惩罚 人脸识别 我在镇武司摸鱼那些年 重生之率土为王 我在大康的咸鱼生活 盘龙之生命进化 天生仙种 凡人之先天五行 春回大明朝 姑娘不必设防,我是瞎子 给这个世界上另一个我 我们这个时代的爱情 千万不要尝试这个姿势巨疼 这厮 那厮 这世界很酷 这城市风很大 这城市风总是很大 人这一生会遇到很多人 这城市风总是很大吉他谱 快穿之我们这班很不乖 这很影视 themass这首歌很恐怖 为什么说鲁冰花这首歌很恐怖 这是英语 这是 这是什么号 这是什么 啊教练这是车里啊别呀 这不是传说这是今日中国 这是什么意思用英语怎么说 这是英语怎么说 这是一篇正经文 老板不要这是在办公室 这是一张吓死900000 这样恋着你 那就这样吧 这样的 这样瘦脸 这样瘦小腿 这样说 这样能减肥 这样瘦屁股 这样长胖 这样才减肥 为什么这样 你总这样说 这样啊 像这样 像我这样 这样才好