Deep Learning L教程(六)

来源:互联网 发布:xampp mysql 密码 编辑:程序博客网 时间:2024/04/29 20:52

本文转自深度学习论坛


稀疏自编码器符号一览表


下面是我们在推导sparse autoencoder时使用的符号一览表:

符号含义\textstyle x训练样本的输入特征,\textstyle x \in \Re^{n}.\textstyle y输出值/目标值. 这里 \textstyle y 可以是向量. 在autoencoder中,\textstyle y=x.\textstyle (x^{(i)}, y^{(i)})第 \textstyle i 个训练样本\textstyle h_{W,b}(x)输入为 \textstyle x 时的假设输出,其中包含参数 \textstyle W,b. 该输出应当与目标值 \textstyle y 具有相同的维数.\textstyle W^{(l)}_{ij}连接第 \textstyle l 层 \textstyle j 单元和第 \textstyle l+1 层 \textstyle i 单元的参数.\textstyle b^{(l)}_{i}第 \textstyle l+1 层 \textstyle i 单元的偏置项. 也可以看作是连接第 \textstyle l 层偏置单元和第 \textstyle l+1 层 \textstyle i 单元的参数.\textstyle \theta参数向量. 可以认为该向量是通过将参数 \textstyle W,b 组合展开为一个长的列向量而得到.\textstyle a^{(l)}_i网络中第 \textstyle l 层 \textstyle i 单元的激活(输出)值.

另外,由于 \textstyle L_1 层是输入层,所以 \textstyle a^{(1)}_i = x_i.

\textstyle f(\cdot)激活函数. 本文中我们使用 \textstyle f(z) = \tanh(z).\textstyle z^{(l)}_i第 \textstyle l 层 \textstyle i 单元所有输入的加权和. 因此有 \textstyle a^{(l)}_i = f(z^{(l)}_i).\textstyle \alpha学习率\textstyle s_l第 \textstyle l 层的单元数目(不包含偏置单元).\textstyle n_l网络中的层数. 通常 \textstyle L_1 层是输入层,\textstyle L_{n_l} 层是输出层.\textstyle \lambda权重衰减系数.\textstyle \hat{x}对于一个autoencoder,该符号表示其输出值;亦即输入值 \textstyle x 的重构值. 与 \textstyle h_{W,b}(x) 含义相同.\textstyle \rho稀疏值,可以用它指定我们所需的稀疏程度\textstyle \hat\rho_i(sparse autoencoder中)隐藏单元 \textstyle i 的平均激活值.\textstyle \beta(sparse autoencoder目标函数中)稀疏值惩罚项的权重.


中文译者

邵杰(jiesh@hotmail.com),许利杰(csxulijie@gmail.com),余凯(kai.yu.cool@gmail.com)


0 0