Large Pose 3D Face Reconstruction 文章理解
来源:互联网 发布:et服装软件图片 编辑:程序博客网 时间:2024/06/05 01:13
Large Pose 3D Face Reconstruction from a Single Image via Direct Volumetric 文章的一点点理解梳理
写在前面
因为我比较弱,在机器学习和三维重建方面都算是新手,所以并不是很理解这篇文章,只是梳理下文章中的模型结构,当做笔记,我相信大家更加优秀,应该能理解的层次比我更深。我这里梳理的顺序按照由小模块向大模块梳理。
Residual Module
文章中称为 residual module ,引用的文章中称为 Residual Learning,是微软发表的文章,中文常翻译为残差学习,源自论文Deep Residual Learning for Image Recognition 这种结构主要解决深度学习层次特别深的时候,容易在BackPropagation过程中梯度消失的问题,使得即便网络结构非常深,梯度也不会轻易消失。
他第一行是卷积路,由三个核尺度不同的卷积串联而成;第二行是跳级路,只包含一个核尺度为1的卷积层。
对于多个残差学习模块串联的情况也可以展开为如图的效果。
对于残差学习的深入理解可以参考知乎问题如何理解微软的深度残差学习?
Hourglass Module
Hourglass Module如上图所示,是Stacked Hourglass Networks for Human Pose Estimation 文章中的一个独立子模块,图中每一个立方体都是一个Residual Module。
可以说这篇文章就是直接用Hourglass module堆出来的了,想要理解这个模型,可能必须要读一下这个模型的出处。这里附一个文章理解。
VRN
Volumetric Regression Network(VRN) 本文作者使用的模型,由多个沙漏模型组合在一起形成。
- VRN模型使用两个沙漏模块堆积而成,并且没有使用hourglass的间接监督结构。
- VRN-guided 模型是使用了Stacked Hourglass Networks for Human Pose Estimation 的工作作为基础,在前半部分使用两个沙漏模块用来获取68个标记点,后半部分使用两个沙漏模块,以一张RGB图片和68个通道(每个通道一个标记点)的标记点作为输入数据。
- VRN-Multitask 模型,用了三个沙漏模块,第一个模块后分支两个沙漏模块,一个生成三维模型,一个生成68个标记点。
参考文献
这里给出几篇比较重要的论文的链接,可以直接免费下载,但后面会不会被墙也不知道……
1. He K, Zhang X, Ren S, et al. Deep Residual Learning for Image Recognition[J]. 2015:770-778.
2. Newell A, Yang K, Deng J. Stacked Hourglass Networks for Human Pose Estimation[C]// European Conference on Computer Vision. Springer, Cham, 2016:483-499.
3. Jackson A S, Bulat A, Argyriou V, et al. Large Pose 3D Face Reconstruction from a Single Image via Direct Volumetric CNN Regression[J]. 2017.
4. Veit A, Wilber M, Belongie S. Residual Networks Behave Like Ensembles of Relatively Shallow Networks[J]. 2016.
- Large Pose 3D Face Reconstruction 文章理解
- 3D Face Reconstruction from a Single Image
- Face Alignment Across Large Poses -- A 3D Solution.
- Head Pose Estimation From a 2D Face Image Using 3D Face Morphing With Depth Parameters [2015]
- 人脸识别论文笔记 Reconstruction-Based Disentanglement for Pose-invariant Face Recognition
- 3D Reconstruction
- 3D Reconstruction
- Dummy 3D Reconstruction
- 大角度人脸转正--Towards Large-Pose Face Frontalization in the Wild
- 3、相机pose的理解(explain_poses)
- 重拾SFM、3D reconstruction
- Pose-Aware Face Recognition in the Wild
- 3D Face replicas
- REAL-TIME 3D RECONSTRUCTION USING SIGNED DISTANCE FUNCTIONS
- Real-Time Camera Tracking and 3D Reconstruction
- 3-D Reconstruction from a Single Still Image-学习《1》
- MATLAB: 3d reconstruction using eight point algorithm
- Camera Calibration and 3D Reconstruction(opencv 2.4)
- 杭电 1020 Encoding
- 从零开始搭建本地mongodb环境
- hm3-算法描述和文档
- 十一月英语学习
- Game of the Rows
- Large Pose 3D Face Reconstruction 文章理解
- 机房重构总结1
- tomcat正常启动后http://localhost:8080/报错404
- 安装GraphViz以供python调用
- Building TensorFlow on Android
- 如何用DiscoGAN学习发现跨域关系(附源代码)
- ACM 并查集
- 多文件目录下makefile文件递归执行编译所有c文件
- [DP] 「CodePlus 2017 11 月赛」找爸爸