计算机视觉基础1——视差与深度信息
来源:互联网 发布:xampp安装教程 linux 编辑:程序博客网 时间:2024/05/16 03:06
资料来源:Robert Collins,CSE486, Penn State第8讲
Stereo Vision
深度信息感知是人类产生立体视觉的前提。生理过程一定是相当复杂,此处,我们只从物理角度,并采用数学的方法来讨论。
Inferring depth from images taken at the same time by two or more cameras.
基本透视投影
透视投影是多对一的关系,投影线上的任何一点对应同一个像点。
如果用两个摄像机,则可以消除这种多对一,从而能够确定第三维坐标Z的值,即深度信息。
为什么可以感知深度信息呢?我们的左右眼从略微不同的角度观察景物,而这种视差与物体所处的位置有关。
重要的概念之一:视差(Parallax)
自己可以体验一下:将手指头放在离眼睛不同距离的位置,并轮换睁、闭左右眼,可以发现手指在不同距离的位置,视觉差也不同,且距离越近,视差越大。
重要概念之二:Anaglyph image(来自wiki)
Anaglyph images are used to provide a stereoscopic 3D effect, when viewed with glasses where the two lenses(两个镜头) are different (usually chromatically opposite) colors, such as red and cyan(青色). Images are made up of two color layers, superimposed(叠加), but offset with respect to each other to produce a depth effect. Usually the main subject is in the center, while the foreground and background are shifted laterally in opposite directions. The picture contains two differently filtered colored images, one for each eye. When viewed through the "color coded" "anaglyph glasses", they reveal an integrated stereoscopic image. The visual cortex of the brain fuses this into perception of a three dimensional scene or composition.
这种立体照片的原理是利用特殊的眼镜,使左右眼接收不同颜色的光线,通过大脑合成立体照片。
关于深度信息的感知理论还在发展中,这是一个复杂的过程,很难用单一的理论来完全描述,决定深度信息感觉的因素很多。如消失线,同类物体的大小,遮挡关系等等。甚至,用单眼也可以感知深度信息。
下面着重借助几何和代数的方法来描述立体感知。先从简单的情况开始......
假设两个相机的内部参数一致,如焦距、镜头等等,为了数学描述的方便,需引入坐标,由于坐标是人为引入的,因此客观世界中的事物可以处于不同的坐标系中。假设两个相机的X轴方向一致,像平面重叠,如下图所示,坐标系以左相机为准,右相机相对于左相机是简单的平移,用坐标表示为(Tx,0,0)
Tx一般称为基线(baseline),根据三角形相似关系,很容易得出空间中的一点P(X,Y,Z)分别在左右像平面上的投影坐标。
因此,左相机像平面像点的坐标为
右相机平面像点的坐标为
显然,深度信息Z和视差(Disparity / Parallax)
转自:http://www.cnblogs.com/gemstone/articles/2293806.html
- 计算机视觉基础1——视差与深度信息
- 计算机视觉基础1——视差与深度信息
- 计算机视觉基础1——视差与深度信息
- 计算机视觉基础1——视差与深度信息
- 计算机视觉基础1——视差与深度信息
- 计算机视觉基础1——视差与深度信息
- 计算机视觉基础1——视差与深度信息
- 计算机视觉基础1——视差与深度信息
- 【转】计算机视觉基础1——视差与深度信息
- 视差与深度信息
- 深度学习与计算机视觉系列(1)_基础介绍
- 深度学习与计算机视觉系列(1)_基础介绍
- 深度学习与计算机视觉系列(1)_基础介绍
- 深度学习与计算机视觉系列(1)_基础介绍
- 深度学习与计算机视觉系列(1)_基础介绍
- 深度学习与计算机视觉系列(1)_基础介绍
- 深度学习与计算机视觉系列(1)_基础介绍
- 计算机视觉学习笔记:深度学习基础——CS231n_assignment1
- 网络协议 TCP 和 UDP
- Hibernate增删改查
- Caffe的matlab接口的基本操作
- Weakly Supervised Dense Video Captioning
- 我国专利法规定的专利类型有三种:发明专利、实用新型专利、外观设计专利
- 计算机视觉基础1——视差与深度信息
- linux termios结构
- Oracle 某一列或者几列 检查在某个字符集合中
- Centos linux下安装7zip
- spark.ml.param.shared
- 索引的使用
- C/C++一维数组与指针
- 面试算法题
- 安卓手机开机动画bootanimation.zip文件制作以及注意事项