我们理解高级视觉吗?---读后总结
来源:互联网 发布:土建计价软件 编辑:程序博客网 时间:2024/06/02 01:11
原文链接:Do we understand high-level vision?
高级视觉缺乏一个唯一的,一致性的定义。最近几十年的工作大多数都集中在对象的识别问题上,主要是在视觉系统的一个场景当中去识别一个或者一群对象。重要的是在其中忽略了对象的位置、大小、光线以及它周围所呈现的物体。当对象识别作为了高层视觉的操作框架的时候,仅仅通过视觉神经来解决问题显然已经不足以解决问题了。所以作者将在这里陈述这项工作所做出的成绩和不足,并且一起讨论了是否应该重新形成我们对高级视觉的理解。
一、直觉性的错误:为什么视觉是如此的困难?
1、3D的世界被转换成了2D的平面图像去处理,其中就会很容易的忽视一些重要的信息
2、我们人类的视觉感知是从人类的进化就开始了,而对于计算机则是不同的过程、
3、我们在视觉系统上的能力扰乱了我们基本的直觉
二、寻求高级视觉操作的定义
关于高级视觉的一个功能性的定义是在某种程度上集中精力于处理对象或者其表面的物理参数,而不是关注于光线投掷到视网膜上所测量到的物理参数。
三、读出对象的身份
对于人类,在视网膜神经细胞上的信息呈现并不是一种形式,它可以很容易的为了引导行为通过顺流神经元很容易的被读出。
对于提取对象信息,在探查高级神经编码上线性分类器是一种合理的解码选择。
四、探索对象识别上面临的挑战
1、定义一个对象是十分困难的。我们可以表达特定对象的名称,但是每个对象都有很多种分类、用途、外观等特性,我们很难用简单的修饰将其准确的表达出来。
2、构建具有代表性的刺激方案对象是困难的。
3、有大量的证据表明高水平视觉皮层的神经元依赖于正在观察的场景。
五、对象识别是正确的框架问题吗?
对于这个问题,应该引用作者的一句比较经典的话:驱动我们对高级视觉理解的关键不在于去解决问题,而是去探索一个丰富的关于视觉要做什么的框架性问题。
- 我们理解高级视觉吗?---读后总结
- linux系统编译链接总结--高级c/c++编译技术读后总结(上)
- linux系统编译链接总结--高级c/c++编译技术读后总结(下)
- <深入理解Java虚拟机:JVM高级特性与最佳实践>读后笔记
- 视觉总结
- 我们真的了解90后吗?
- 深入理解java虚拟机读后总结(个人总结记录)
- 《认知与设计——理解UI设计准则》笔记(2) 为观察结构优化我们的视觉
- 《认知与设计——理解UI设计准则》笔记(3) 我们寻找和使用视觉结构
- 如何理解计算机视觉
- 《深入理解Java虚拟机》读后总结 (一)JVM内存模型
- 《深入理解Java虚拟机》读后总结 (二)JVM内存分配
- 《深入理解Java虚拟机》读后总结 (三)JVM内存监控
- 《深入理解Java虚拟机》读后总结 (四)JVM垃圾回收
- [深入理解JAVA虚拟机]读后个人总结二之JAVA内存区域
- 《深入理解Java虚拟机》读后总结之JVM垃圾回收
- 【计算机视觉】Objectness算法(一)---总体理解,整理及总结
- 一年后我们长大成人
- <机器学习实战>--朴素贝叶斯(一)
- linux系统基本命令(九)
- 编码 —— PCM 编码
- 频率域图像增强及MATLAB实现
- hdu5033Building 单调栈
- 我们理解高级视觉吗?---读后总结
- 6.移动端事件--阻止冒泡
- myeclipse安装activiti插件
- 171014 数据库建模(mysql5.0)
- windows编译-spidermonkey
- 10.14 考试 T2 第k大区间
- linux内核驱动 之 module_init解析 (上)
- [LeetCode] 650. 2 Keys Keyboard
- Java开发练习2,类与对象