深度学习中对 end2end的理解

来源：互联网发布：天策雪河军爷捏脸数据编辑：程序博客网时间：2024/05/23 02:02

在神经网络中，经常看到end2end的训练方式。

end2end在不同的应用场景中有不同的诠释，对于视觉领域而言，神经网络的输入为图片，输出就是我们想要的结果。例如:

1,自动驾驶中，输入为道路的图片，输出就是转向的角度。

2，视觉机器人，输入的是图片，输出就是机械手运动的指令。

3，目标识别中，输入为待检测图片，输出就是检测到的目标类别以及目标位置。

从目标检测的角度理解：

非end2end模式下进行目标检测，一般神经网络中会分为两个部分，第一部分是Region Proposal，这部分的功能是负责找出图片中目标的位置和大小。第二部分就是判断第一部分中是否真的存在目标，以及目标是属于哪一类，判断一般是在CNN中来完成的。这种套路一般都是在RCNN中经常使用。

在end2end模式下，位置和类别全部由一个模型解决，原始图像输入，模型输出的结果就是位置和类别。一端输入原始图像，一端输出想要的结果，只关心输入和输出，中间的步骤全部都不管。

这里写图片描述

end2end的好处：

通过缩减人工预处理和后续处理，尽可能使模型从原始输入到最终输出，给模型更多的可以根据数据自动调节的空间，增加模型的整体契合度。end2end强调的是全局最优，中间部分局部最优并不能代表整体最优。

阅读全文

0 0