【论文笔记】Depth Map Prediction from a Single Image using a Multi-Scale Deep Network
来源:互联网 发布:淘宝与客服对话不了 编辑:程序博客网 时间:2024/05/11 02:59
阅读时间:2015.04.26
论文源:NIPS2014
作者及单位: David Eigen deigen@cs.nyu.edu
Christian Puhrsch cpuhrsch@nyu.edu
Rob Fergus fergus@cs.nyu.edu
纽约大学
主要内容:通过CNN来进行对单张图片进行深度估计,单张图片进行深度信息估计做的人比较少,一般是用双目摄像头做的。在这里,作者把CNN当作一个黑盒来看待,用CNN来直接学习图像到它的深度图像信息的映射。
创新点:
- 正如文章题目所言,相对于传统的CNN,它是多尺度的,(其实也就是两个尺度,一个粗粒度的,一个细粒度的),这个创新点有点弱。
- 对于第二个创新,则是它采用了一个新的损失函数形式,也是加一个类似于正则化项的东西。
其它的没有了,看这篇文章主要是因为我目前做的也是用图像来做回归,看看它这边的损失函数有什么新的东西没有。
网络结构:
这边解析一下它的网络结构:
- 两个层次的结构,第一个网络是由一个除粒度的网络结构,其输入是304 \times 228 大小的图片,而它的输出,则是原图像大小的1/16 左右,这个可以指定,因为它就是设计的全连接层的维度。通过ground true图像就可以训练这样网络了。
- 第二个网络结构是细粒度的网络,但是它也是作用在原输入图像上面,并且第二层卷积层会加上第一个网络的输出。第二个网络没有全连接层,是属于全卷积网络。
损失函数:
- 损失函数,同时也是对其结果的评价标准,这是文章的第二个创新点,其损失函数为: 其中,
- 第二项\alpha 表示平均的误差项,第一项的前面部分表示每个像素之间的误差项,把第二项加到第一项中做为整体,可以使得同时满足平均误差小同时每个像素的误差也小,相当于一个惩罚项。
实验结果:
版权声明:本文为博主原创文章,未经博主允许不得转载。
0 0
- 【论文笔记】Depth Map Prediction from a Single Image using a Multi-Scale Deep Network
- 【深度学习论文笔记】Depth Map Prediction from a Single Image using a Multi-Scale Deep Network
- 学习笔记-Depth Map Prediction from a Single Image using a Multi-Scale Deep Network
- [深度学习论文笔记][Depth Estimation] Depth Map Prediction from a Single Image using a Multi-Scale Deep Netw
- Depth Map Prediction from a Single Image using a Multi-Scale Deep Network
- Depth Map Prediction from a Single Image using a Multi-Scale Deep Network
- 论文笔记 MSCNN:A Unified Multi-scale Deep Convolutional Neural Network for Fast Object Detection
- [论文分析] Face Landmark Localization Using a Single Deep Network
- MSCNN 论文解析(A Unified Multi-scale Deep Convolutional Neural Network for Fast Object Detection
- MSCNN 论文解析(A Unified Multi-scale Deep Convolutional Neural Network for Fast Object Detection
- [论文解读] MSCNN: A Unified Multi-scale Deep Convolutional Neural Network for Fast Object Detection
- (2015年CVPR)Deep Convolutional Neural Fields for Depth Estimation from a Single Image 翻译
- 快速去阴影--Fast Shadow Detection from a Single Image Using a Patched Convolutional Neural Network
- 论文笔记:TextBoxes: A Fast Text Detector with a Single Deep Neural Network
- [论文笔记]TextBoxes A Fast Text Detector with a Single Deep Neural Network
- 每日论文Photo-Realistic Single Image Super-Resolution Using a Generative Adversarial Network
- Semantic Scene Completion from a Single Depth Image
- 《Photo-Realistic Single Image Super-Resolution Using a Generative Adversarial Network》阅读笔记
- 查看Ambari自动配置的hive与spark sql元数据库
- 使用sed截取或替换文件内字符
- 机顶盒开发中获取当前IP地址
- 关于运行C++程序的过程中遇到的问题小结
- 关于android全屏截图,无需root,无状态栏,2个方法
- 【论文笔记】Depth Map Prediction from a Single Image using a Multi-Scale Deep Network
- 显著性检测部分代码链接
- memcached windows 7 64bit 环境下安装
- 使用基本Bezier求值器绘制曲线和曲面
- APP学习笔记
- 安卓安装包过程中提示 INSTALL_PARSE_FAILED_MANIFEST_MALFORMED的原因之一
- SQL Server相关
- iOS Xcode中Version和Build的区别
- Hibernate从入门到精通(五)一对一单向关联映射