激活函数

来源：互联网发布：php上传文件原理编辑：程序博客网时间：2024/04/30 00:43

ReLU及其扩展

目前，深度学习中最常见的激活函数是g(z)=max{0,z} ，翻译为整流线性单元（rectified linear unit）或者称为ReLU。

“该激活函数是被推荐用于大多数前馈神经网络的默认激活函数。将此函数用于线性变换的输出将产生非线性变换。然而，函数仍然非常接近线性，在这种意义上它是具有两个线性部分的分段线性函数。由于整流线性单元几乎是线性的，因此它们保留了许多使得线性模型易于使用基于梯度的方法进行优化的属性。它们还保留了许多使得线性模型能够泛化良好的属性。计算机科学的一个公共原则是，我们可以从最小的组件构建复杂的系统。就像图灵机的内存只需要能够存储0 或1 的状态，我们可以从整流线性函数构建一个万能函数近似器。”

以上摘抄自Goodfellow的《深度学习》一书。

ReLU实际上是两段线性函数，当处于激活状态时，它的导数处处为1，保持比较大；但是其在另一半定义域上恒为0，不能通过梯度进行学习。因而有了一些ReLU的扩展函数。

主要有三个：