【论文阅读二】FaceNet：A Unified Embedding for Face Recognition and Clustering

来源：互联网发布：沙特知乎编辑：程序博客网时间：2024/05/23 21:41

博客用于知识记录和学习交流，欢迎大家互动学习。
作者：JackGao24 博客园
作者：JackGao16 CSDN
文章链接：
邮箱：gshuai16@mail.ustc.edu.cn

论文连接：FaceNet：A Unified Embedding for Face Recognition and Clustering

摘要：

近年来虽然人脸识别的技术取得了飞速的发展【10，14，15，17】，但人脸的验证和识别在自然条件下面临着挑战。本文的作者实现了一个新的人脸识别系统：FaceNet，该系统直接将人脸图像映射到欧几里得空间，欧几里得距离（欧几里得距离：向量内积值，这里的向量的维度和要识别的图像的维度有直接的关系）代表了人脸图片之间的相似性。只要将图像映射到空间中，人脸的识别、验证、聚类等任务都可以轻松的完成。
使用训练的深度卷积网络来优化embedding本身，而不是像之前深度学习的方法针对连接层瓶颈的优化。训练中使用粗略的对齐和非对齐的人脸区块的triplets，这些triplets通过一个出色的在线triplets挖掘的方式得到。每张人脸仅仅使用了128Bytes就获得了出色的效果。
FaceNet在LFW数据集上，准确率为0.9963，在YouTube Faces DB数据集上，准确率为0.9512。比目前发布的做好的结果【15】错误率降低了30%。

前言

FaceNet是一个通用的系统，可以用于人脸验证（是否是同一人？），识别（这个人是谁？）和聚类（寻找类似的人？）。FaceNet采用的方法是通过卷积神经网络学习将图像映射到欧几里得空间。使embedding空间中的第二范数直接对应人脸的相似性：同于人的面部距离较小，不同的人距离较大。一旦embedding成功，上述问题的处理就会变得很简单：人脸的验证仅仅涉及到两个embedding之间的阈值，识别成为k-nn的分类问题，而聚类可以使用诸如k - means或聚集聚类的现成的技术来实现。

阅读全文

1 0