[转载]人脸识别的方向问题

来源：互联网发布：淘宝网鞋子女鞋运动鞋编辑：程序博客网时间：2024/06/06 06:52

作者:dodo

时间:

链接:

兼答Williams兄问。http://prfans.com/forum/viewthread.php?tid=265

就像loveisp兄说的，人脸识别中已经解决的问题还很有限。值得研究的问题很多。关键是有没有恒心和能力去做的问题。这里就简单谈谈人脸识别方向问题。

1）detection
face detection 的进展比 recognition 要好。当然前者也是实际应用的基础。
但是就detection来说，现在基本上还都是基于传统框架上的learning方法，新的思维还有待探索。是实际做过这类工作的人都有体会，training不是个容易的过程。比如不基于learning的 saliency maps, attention 等相关领域的方法都会随着时间慢慢渗透到detection中来。有心的人可以留意留意，或是有可能做些引导性的工作。

2）recognition

a. feature extraction
对于face recognition来说，最重要的在于合理的 visual feature 的提取，关于这一点伙伴们在人脸贴中都有讨论过。而就现在可以用的 visual feature extractor 来说，能用的很有限，也就是那几个。现在最常用的也就是 Gabor, LBP。也有用SIFT这类feature作识别的。Gabor有一个缺点就是速度快不了，所以现在在尝试的实际系统中，一般选择LBP：1）能保证一定的效果；2）相对来说，速度快。

有一点值得强调，现在detection和recognition用的feature一般都是不一样的，由于种种原因，现在这两个任务都是独立分开来做的。当然，从实际应用的角度来说，如果两者结合在一起效率会更高。这几年，这类工作也有出现。我认为对做实际应用系统的伙伴们，这类方向值得注意。

b. feature selection and classifier
feature提好之后就是怎么用的问题，一般就用两种选择 1）直接上 classifier 2）做个处理之后在上classifier，比如 feature selection 或是dimensionality reduction。这两个都是脱离于人脸识别之外的一般性问题。
boosting相关的方法和svm相关的方法还是这类问题的首选。feature selection 这一块能做的工作比较多。由于boosting相关思想的有效性，还是这些问题的主题；另外，基本L1的sparse方法会在这一块发挥重要作用。进而会把 combinatorics 的方法和思想引进 feature selection 和 classifier这两个领域中来。这是一个很有潜力的方向，有兴趣的朋友可以看看。论文也很好找，应用Salu兄的 “逐步细化搜索法” ，第次搜索几个关键词就可以了。比如
1) L1 regularization, sparse; classifier, feature selection,....
2) feature selection, classifier, classification; simplex, complex, polyhedra, polyhedron, ....
然后再在搜到的论文中得到更有用的信息，找更合适的主题。

我建议对这一块比较感兴趣的伙伴们，可以先看看SDP、convex optimization、和 geometric combinatorics 相关的书籍，不一定要细看，开卷有益。

c. face recognition和传统的分类问题并不等价！
不要把传统的基于子空间提取鉴别特征的人脸识别方法当作人脸识别本身！对于新人来说，这是个误区。那些方法，比如 PCA, LDA, LPP, MFA等等，对于人脸识别来说仅仅能起到锦上添花的作用。准确的说，那些都是和传统分类问题有关的方法，不是人脸识别问题本身。它们有它们的意义，但是不要和人脸识别划等号。
Fisherfaces是人脸识别中的一个影响力非常大的方法。而正是这个方法对人脸识别造成了非常负面的影响。由于现在用子空间方法以人脸识别为主题（甚至为题目）的论文铺天盖地，人们常常误解为那是在解决人脸识别问题！对于真正想解决人脸识别问题的新人来说，这是个非常不好的诱导。
另外，也不要随意认为那些已经成名的大家发的论文就是正确的方向。要广泛听听意见，根据自己的实际考察，然后做出判断。盲从只会迷失方向。

我劝想做人脸识别的伙伴们，在FRGC、FERET这样的大规模人脸库上，自己实际比较一下Gabor、LBP、RDA、Fisherfaces等方法，或是结合应用，心中自然有数。

3) 3D related.

虽然本人不看好三维人脸识别的实际应用前景，但是三维人脸识别在pose变化等情况下确实展现了非凡的能力，而且确实是在做人脸识别问题本身。值得广泛深入探讨。本人在这一块了解有限，不敢妄言。
有兴趣的朋友可以找找相关论文参考参考。有经验的伙伴可以多谈谈。

结束语

1）关于我在《人脸识别》帖子中列出的种种方法，就像我说过的一样，“就方法论方法”。这个帖子算是对前两个帖子在人脸识别问题上的一点补充。
2）由于本人所知有限，写出来的也只是冰山之一角；而且都是些个人理解和观点，仅供伙伴们参考，不要太当回事。
3）写帖子的本意就是想帮助新人们尽快了解相关的领域，但是我们也应该看到另外一面：往往先入为主，把新人诱导到所写的东西上。再次强调，写出来的东西仅仅是作者个人在某些方向上的理解和观点，仅仅当作参考，不要盲从。
4）另外，在这一块一直缺少boosting、svm、3d face recognition相关的帖子，还是希望了解的伙伴们能写写。

欢迎伙伴们积极参与讨论，发表意见，共同成长，共同受益。

（本帖在其它论坛和bbs上贴出来时，用的题目是《dodo：人脸识别的方向问题》）