深度学习中对 end2end的理解

来源:互联网 发布:天策雪河军爷捏脸数据 编辑:程序博客网 时间:2024/05/23 02:02

深度学习中对 end2end的理解

在神经网络中,经常看到end2end的训练方式。

end2end在不同的应用场景中有不同的诠释,对于视觉领域而言,神经网络的输入为图片,输出就是我们想要的结果。例如:

1,自动驾驶中,输入为道路的图片,输出就是转向的角度。

2,视觉机器人,输入的是图片,输出就是机械手运动的指令。

3,目标识别中,输入为待检测图片,输出就是检测到的目标类别以及目标位置。

从目标检测的角度理解:

​ 非end2end模式下进行目标检测,一般神经网络中会分为两个部分,第一部分是Region Proposal,这部分的功能是负责找出图片中目标的位置和大小。第二部分就是判断第一部分中是否真的存在目标,以及目标是属于哪一类,判断一般是在CNN中来完成的。这种套路一般都是在RCNN中经常使用。

​ 在end2end模式下,位置和类别全部由一个模型解决,原始图像输入,模型输出的结果就是位置和类别。一端输入原始图像,一端输出想要的结果,只关心输入和输出,中间的步骤全部都不管。

这里写图片描述

end2end的好处:

​ 通过缩减人工预处理和后续处理,尽可能使模型从原始输入到最终输出,给模型更多的可以根据数据自动调节的空间,增加模型的整体契合度。end2end强调的是全局最优,中间部分局部最优并不能代表整体最优。

原创粉丝点击