哺乳动物视觉皮层的深层结构研究

来源:互联网 发布:ubuntu分辨率命令 编辑:程序博客网 时间:2024/04/28 23:18

参考文献 Deep Hierarchies in the Primate Visual Cortex : what can we learn for computer vision ?

------------------------------------------------------------------------------------------------------------------------------

好久没写博客了,C币没进账好难受(╯﹏╰)

这一周一直在看论文,感觉这篇PAMI的文章写得还是很不错的,不过得耐心来读,信息量很大。

这篇博客主要是贴出我在文章中摘取的觉得有价值的结论。

------------------------------------------------------------------------------------------------------------------------------

1. 哺乳动物的大脑皮层中,有55% 的皮层神级与视觉有关系,处理视觉问题的时候能用到8-10层的结构


2. 哺乳动物处理视觉问题是分为几个channel来分别处理的,具体表现在,会有专门的channel来处理颜色问题,也会有专门的channel来处理边缘,轮廓,形状等问题,也会有专门的channel处理动作信息,也会有专门的channel处理纹理,3D等信息。

这一点与我们目前流行的CNN模型是有很大的不同的,我们知道,CNN对于颜色特征与边缘特征的提取是混在一起完成的,但是人脑其实是分开处理的


3. 视觉信号的传输过程为:视网膜->LGN->视觉皮质->分为3条线:occiptal cortex(62%), ventral pathway(22%), dorsal pathway(11%)


4. occiptal cortex 完成的是初级的视觉问题的处理


5. ventral pathway 处理的是物体识别和分类的问题。ventral pathway的感受野通常有fovea(就是眼睛中非常靠中心的黑漆漆的东东),fovea是视网膜的中心部分,分辨率高。也就是说在人眼中,视觉中心是高分辨率的,但是非视觉中心的就变得模糊了。

ventral pathway 的特征复杂度已经可以支持“物体层次”的问题了,也就是说已经有了整体概念了。但是大多数的神经元是在有整体概念之前就有响应了,所以说预示着用多种神经元的响应编码的方案来处理物体级别的问题。


6. dorsal pathway 包含动作域MST以及位于posterior parietal cortex的视觉区域。dorsal pathway用于分析空间以及行动的计划,与ventral pathway相比,感受野更大,特征更为复杂。MT负责简单的动作,而MST负责复杂的动作。


7. 除去ventral pathway与dorsal pathway,还有两个stream需要注意,magnocellular(M-)与parvocellular(P-),M-是大细胞流,P-是小细胞流。小细胞对于颜色敏感,感受野小,负责剧烈的视觉变化(我觉得应该是光线颜色的变化);大细胞空间尺度小(channel少),但是分辨率高。


8. 有一个常识值得注意:层次越高,固有信息越少,也就是说对于高层的特征是不断改变的,但是底层的颜色跟边缘特征等等是会一直保持的。


后面还有很多内容,但是感觉内容差不多,可以直接跳到Conclusion部分,有一点我觉得还是很有价值的

9. 人脑在处理视觉问题的时候是将视觉问题分为 颜色、形状、动作等多个通道来处理的,但是在主流的CNN模型中,提取的特征是颜色特征、边缘特征混合的,所以可以设计一个新的CNN结构,来把颜色跟形状特征分别处理。


就这些吧,看PAMI真的好累啊。





0 0