【论文阅读二】FaceNet:A Unified Embedding for Face Recognition and Clustering

来源:互联网 发布:沙特 知乎 编辑:程序博客网 时间:2024/05/23 21:41

博客用于知识记录和学习交流,欢迎大家互动学习。
作者:JackGao24 博客园
作者:JackGao16 CSDN
文章链接:
邮箱:gshuai16@mail.ustc.edu.cn

论文连接:FaceNet:A Unified Embedding for Face Recognition and Clustering

摘要:

  近年来虽然人脸识别的技术取得了飞速的发展【10,14,15,17】,但人脸的验证和识别在自然条件下面临着挑战。本文的作者实现了一个新的人脸识别系统:FaceNet,该系统直接将人脸图像映射到欧几里得空间,欧几里得距离(欧几里得距离:向量内积值,这里的向量的维度和要识别的图像的维度有直接的关系)代表了人脸图片之间的相似性。只要将图像映射到空间中,人脸的识别、验证、聚类等任务都可以轻松的完成。
  使用训练的深度卷积网络来优化embedding本身,而不是像之前深度学习的方法针对连接层瓶颈的优化。训练中使用粗略的对齐和非对齐的人脸区块的triplets,这些triplets通过一个出色的在线triplets挖掘的方式得到。每张人脸仅仅使用了128Bytes就获得了出色的效果。
  FaceNet在LFW数据集上,准确率为0.9963,在YouTube Faces DB数据集上,准确率为0.9512。比目前发布的做好的结果【15】错误率降低了30%。

前言

  FaceNet是一个通用的系统,可以用于人脸验证(是否是同一人?),识别(这个人是谁?)和聚类(寻找类似的人?)。FaceNet采用的方法是通过卷积神经网络学习将图像映射到欧几里得空间。使embedding空间中的第二范数直接对应人脸的相似性:同于人的面部距离较小,不同的人距离较大。一旦embedding成功,上述问题的处理就会变得很简单:人脸的验证仅仅涉及到两个embedding之间的阈值,识别成为k-nn的分类问题,而聚类可以使用诸如k - means或聚集聚类的现成的技术来实现。

阅读全文
1 0
原创粉丝点击