文章解析整理:《如果你还没搞懂LSTM 网络,那本文绝对值得一看》

来源:互联网 发布:c语言指针难点应用 编辑:程序博客网 时间:2024/06/09 18:01

本文仅是博主自己学习用来加深印象和留存整理,对该内容有兴趣请去阅读原文。

原文地址:
https://mp.weixin.qq.com/s?__biz=MzI0ODcxODk5OA==&mid=2247485477&idx=1&sn=0d6bd491b593b497eb1f9d92f9afb10d&chksm=e99d3bdcdeeab2ca436750184f999a58b849be41a3a4ec1bd039b531accae124a2297e57ac0e&scene=21#wechat_redirect

循环神经网络(RNN)

循环神经网络(Recurrent Neural Networks)的特点是带有环,能使信息持久化,基于前面的信息进行处理。
这里写图片描述
但换言之,RNN和普通的神经网络也没什么不同。一个RNN可以看作是网络间的信息传递。
这里写图片描述

RNN在一系列的任务中都取得了令人惊叹的成就,比如语音识别,语言建模,翻译,图片标题等等。

LSTM(Long Short Term Memory)是一种特殊的循环神经网络,LSTM是RNN中出类拔萃的存在。

长期依赖的问题

RNN主要可以通过训练来预测待测位置和相关信息距离较小时的情况,比如预测句子“the clouds are in the sky”中的最后一个单词。而对于距离较远的上下文消息时,比如预测句子“I grew up in France… I speak fluent French”中的最后一个单词,RNN就显得无能为力了。幸运的是,LSTM可以用来解决这些。

LSTM网络

LSTM全称为长短期记忆网络,能够学习到长期依赖关系,能够记住长期信息。

普通RNN重复模块结构非常简单,例如只有一个tanh层。LSTM的重复模块中有四个神经网络层。
这里写图片描述
这里写图片描述

LSTM核心思想

LSTM的关键是元胞状态(Cell State),元胞状态有点像传送带,贯穿整个链,上面承载着信息。
这里写图片描述

LSTM通过门结构对元胞状态添加或者删除信息。
0值表示不允许信息通过,1值表示让所有信息通过。一个LSTM有3个这种门,来保护和控制元胞状态。

LSTM的分布详解

LSTM的第一步是决定我们将要从元胞状态扔掉哪些信息。该决定由叫做“遗忘门(Forget Gate)”的Sigmoid层控制。遗忘门观察ht1xt,对于元胞状态Ct1中的每一个元素输出一个0~1之间的数。1则完全保留该信息,0表示完全丢弃该信息。
遗忘在什么时候发生呢?元胞状态可能包含当前主语的性别信息,当遇到一个新的主语时,我们就需要把旧的性别信息遗忘了。
这里写图片描述

下一步是决定我们对信息的存储。类似于前面,叫做输入门的层决定我们要更新的信息,另一个层,进一步判断候选值,之后就用于元胞状态的更新。将旧元胞状态Ct1更新到新状态Ct
这里写图片描述
这里写图片描述

最后,需要决定最终的输出。总之是通过一定的限制,输出元胞的需要的部分。

LSTM的变种

提到了一些LSTM的改进版本,主要是对遗忘信息,记忆信息的更改和优化。

阅读全文
1 0
原创粉丝点击
热门问题 老师的惩罚 人脸识别 我在镇武司摸鱼那些年 重生之率土为王 我在大康的咸鱼生活 盘龙之生命进化 天生仙种 凡人之先天五行 春回大明朝 姑娘不必设防,我是瞎子 大班牙又痛又摇怎么办 大班安全教案着火了怎么办 小班社会生病了怎么办反思 脚扭伤了怎么办的反思 中班安全迷了眼怎么办 15个月的小孩长泡疹怎么办 墨盒加错颜色墨水怎么办 墨盒颜色加错了怎么办 uV打印有色差是怎么办 cmyk和rgb有色差怎么办 染头发新长出来怎么办 白色衣服弄上口红怎么办 口红弄到牛仔裤上怎么办 口红弄到沙发上怎么办 做了拔罐后背疼怎么办 拔罐拔出血水后怎么办 拨了罐浑身疼怎么办 拔完火罐洗澡疼怎么办 拔罐之后脊背疼怎么办? 五个月的狗胆小怎么办 电脑颜色不正常分辨率调不了怎么办 宝宝认人怎么办 五个月 新生儿42天听力筛查未通过怎么办 幼儿大便干燥拉不下粑粑怎么办 宝宝大便干燥拉粑粑带浓血怎么办 新生儿便秘4天了怎么办 写卷子的题目不认识怎么办? 2个月小猫尿床怎么办 安全教案鱼刺卡住了怎么办 被鱼刺卡住怎么办安全教案 小班健康教案生病了怎么办 被蜜蜂蛰了怎么办教案 走丢了怎么办大班反思 小孩吃了硬物怎么办 小孩吞了硬物怎么办 小学二年级孩子成绩不好怎么办 二年级孩子成绩不好怎么办 一年级学的不好二年级怎么办 17个月宝宝夜奶怎么办 小孩吃积食了吐怎么办 11个宝宝不会爬怎么办