RNN学习(一) 神经网络概述

来源:互联网 发布:ps软件百度云 编辑:程序博客网 时间:2024/06/06 09:01
  1. 参考LectureNotes3
  2. 神经网络可用于非线性分类
    • 如图
      这里写图片描述
    • 神经元接受n个输入,产生一个输出
    • 神经元输出函数可以有
      • sigmoid 这里写图片描述
        也可以表示称这里写图片描述
        这里写图片描述
      • binary logistic regression
      • softmax 等等
    • 例如想知道”Museums in Paris are amazing”中Paris是否是一个命名实体。可以使用如下网络建立一个分类器。
      • 假设我们用一个4维词向量表示一个词,使用5个词的窗口作为输入,则输入x是一个20维向量,使用8个sigmoid函数作为隐层,产生一个输出数据,则
        这里写图片描述 这里写图片描述
        这里写图片描述
      • 最优化措施:maximum margin objective,确保计算出正确标签的分数比计算出错误标签的分数高。令s表示计算出正确标签的窗口”Museums in Paris are amazing”,sc表示计算出错误标签的窗口”Not all museums in Paris”,则目标函数是最大化(ssc)或最小化(scs)。 但由于我们只关心正确的分数比错误的分数高,因此若sc>serror=(scs),否则为0,即这里写图片描述 或者更加精确这里写图片描述
      • 梯度下降算法
  3. 梯度检查
  4. 正则化
  5. 一些常见的神经元函数:sigmoid, tanh, soft sign, relu
  6. 初始化:
    这里写图片描述
  7. 学习速率:Adagrad
0 0
原创粉丝点击