机器视觉与脑神经科学

来源:互联网 发布:传世知行公关公司 编辑:程序博客网 时间:2024/04/28 22:03

曾有研究表明一般人类对世界80%左右的认知都来自于视觉,且视觉更易记忆。现在交叉学科的发展让机器视觉不止满足于算法的提升发明,很多人试图从生物、神经等学科解释或提出CV里的模型。Itti大牛的Saliency模型就是基于神经科学提出的(附其论文网址http://ieeexplore.ieee.org/xpls/abs_all.jsp?arnumber=730558&tag=1)。

但关于人类大脑的研究还远远有待发展,大脑的奥秘我们了解得很少,只能从已有的其他学科知识看能否对特定研究领域有些启发,那今天我们来看一下神经科学中对于视觉的描述解释。

一.引言

1.      视网膜处于眼睛背部,这里有着将光能转化为神经活动的光感受器。眼睛其余部分像照相机一样在视网膜上留下清晰但短暂的图像。眼睛还有自动调节亮度差异并自动聚焦,跟踪等功能。

2.      每只眼睛可以看做有两个重叠的视网膜,一个在高亮度工作,一个在低亮度工作。而视网膜的输出的是其接受图像的不同部位的光强之差,与绝对光强几乎无关。

3.      视网膜神经元轴突汇聚成视神经把视觉信号以电信号的方式从丘脑背侧的LGN(lateral geniculate nucleus)传至大脑。

 
二.光的特性

1.      光是一种能量波,不同波长的光在大脑里面被解释成不同颜色,引发色觉。

2.      光与物体的相互作用有反射折射和吸收三种。吸收光能则转换能量(晒太阳取暖),我们所见物体是因为物体反射了光,眼睛成像是通过眼中介质折射入视网膜形成。

 

三.眼睛的结构

在很多脊椎动物和一些软体动物中,眼睛通过把光投射到对光敏感的视网膜成像,在那里,光线被接受并转化成信号并通过视神经传递到脑部。通常眼睛是球状的,当中充满透明的凝胶状的物质,有一个聚焦用的晶状体,通常还有一个可以控制进入眼睛光线多少的虹膜。


四.眼睛中图像的形成

1.   平行光线穿过眼中的角膜、房水等时发身了折射,故而汇聚到眼睛背部的一点(聚焦)。从折射表面到平行光的汇聚点的距离称为焦距,焦距的倒数称为屈光度。由于水与眼睛较接近,折射程度较小,这就导致裸眼在水中看东西很模糊,聚焦力很低。

 

2.   晶状体可以自动调节对远/近处的光线进行聚焦,瞳孔收缩增加聚焦深度(就像照相机减少光空大小)。

五.视网膜的显微解剖

1.存在两种光感受器:视杆光感受器对光线敏感许多,主导暗视觉,主要分布在视网膜周边;视锥光感受器主导明视觉,主要分布在视网膜中央  

 

 

六.视觉图像形成与视觉信号处理

1.      与光照相比,黑暗才是对光感受器的合适刺激,当阴影掠过光感受器,他会释放更多的递质;

2.      对比对明暗感知影响


如上图。中间的灰度值是一样的,但左边灰度方块看起来亮一些。因为我们的神经节细胞有着放大边界反差的功能,即记录的是中心-周边感受野范围内刺激的差额。因在感受野中心内看到阴影的细胞会兴奋,看到光照的细胞会被压抑。故视觉系统是对局部空间的变化进行检测,而非全局的进行幅度检测;

3.      感受野是视网膜上给光刺激能改变细胞膜电位的区域。视网膜上1mm对应于3.5°视角,双极细胞感受野直径在视网膜中心不到1°,在周边则大于1°。感受野中心为撤光区域,即对更深阴影产生更高频的电位变化。感受野周边为给光反应区。        

                                                                       

4.      M型细胞与P型细胞与非M非P细胞

M细胞对移动刺激的检测具有重要意义,因其对感受野中心刺激为瞬间放电,且对颜色不敏感,占5%;

P细胞对形状及细微处更敏感,因其放电时长与刺激存在时长一致,主要处理黄-蓝信息(Y-B在P细胞中是对立色),占90%;

非M非P,处理颜色信息,占5%。

 

七.大脑的并行处理

前面已经介绍了M、P、非M-非P三种细胞,在信号传递中这三种细胞有着到大脑皮层的不同通道,如下图所示




M细胞通导称为M通道:LGN可以为一个眼睛激活,对瞬间视觉刺激有反应,对光的波长不敏感;IVCα具有单眼的方位选择性;IVB层细胞具有方向选择性的感受野(对双眼刺激都有反应)。左下图为方位选择性(主管形状),右下图为方向选择性(主管运动方向)。

 

P细胞通道称为P-IB通道:对光的波长不敏感,对刺激的方位具有高度选择性,被认为此通道特化为对物体形状进行分析。

最后一种称为斑块通道:其感受野中心具有红-绿或黄-蓝对立,不具备周边感受野,不具有方位选择性,认为是特化为对物体颜色进行分析。

 

八.外视皮层

大脑皮层间的视觉通路

 

 

 V1:接受LGN信息的第一个皮层区域。

V4:具有方位选择性和颜色选择性,负责对形状以及颜色的感知

IT:一些颜色以及抽象形状对此区是良好刺激,其中小部分神经元对面孔图像有强烈反应。(这是不是说明大脑还有许多被特化为识别某一类物体或形状的区域?)

MT:几乎所有细胞都具有对光的瞬时反应以及方向选择性,对有限运动方向的刺激有反应。有大量方向柱(我的理解是向Gabor机一样)。也许,对空间点运动的感知来源于对360°范围内方向选择柱的活动性比较。(直线的方向柱)

 

 MST:对直线移动(类似MT),辐射状移动,环形移动(顺逆时针)敏感。

 



原创粉丝点击