机器学习_初识attention
来源:互联网 发布:ik hr人力资源软件 编辑:程序博客网 时间:2024/05/21 09:20
【1】NLP中有一类问题:给定一段上下文(context),生成一段与context相关的(target)
eg:翻译/阅读理解/摘要生成
【2】这类问题需要RNN解码,用一个 RNN encoder读入context, 得到一个context vector(RNN的最后一个hidden state);然后另一个RNN decoder以这个hidden state为起始state,依次生成target的每一个单词。
【3】这种做法的缺点是,无论之前的context有多长,包含多少信息量,最终都要被压缩成一个几百维的vector。这意味着context越大,最终的state vector会丢失越多的信息。输入sentence长度增加后,最终decoder翻译的结果会显著变差。
【4】因为context在输入时已知,一个模型完全可以在decode的过程中利用context的全部信息,而不仅仅是最后一个state。这就是attention思想
【5】https://www.zhihu.com/question/36591394
阅读全文
0 0
- 机器学习_初识attention
- 机器学习_初识神经网络
- 机器学习实战_初识kNN算法_理解其python代码
- 机器学习实战_初识决策树算法_理解其python代码(一)
- 机器学习实战_初识决策树(ID3)算法_理解其python代码(二)
- 机器学习实战_初识朴素贝叶斯算法_理解其python代码(一)
- 机器学习实战_初识朴素贝叶斯算法_理解其python代码(二)
- 初识机器学习
- 初识机器学习
- 机器学习 *** 初识流形
- 初识机器学习
- 初识机器学习
- 初识机器学习
- Python机器学习初识
- 学习_机器学习
- 机器学习(一)初识机器学习
- 补:机器学习实战_初识决策树(ID3)算法的绘制树形图的代码
- Lecture 1:机器学习初识
- spring的module-context.xml文件报找不到dubbo.xsd文件错误
- 机器学习实用教程(译)-1
- Array Partition I[LeetCode 561]
- cvc-complex-type.2.4.a: Invalid content was found starting with element
- C#图解教程 学习笔记!!
- 机器学习_初识attention
- Spring 注解的作用
- SpringBoot初始教程之Servlet、Filter、Listener配置
- [翻译中]【Scikit-Learn 中文文档】二十八:交叉验证
- 1063. 计算谱半径(20)--Python
- 服务进程自启动脚本,实现每分钟检查服务运行状态
- 点击判断APP是否存在跳转(车贴码查询结果站点)
- jQuery上传插件Uploadify 3.2在.NET下的详细例子
- 还有这种操作?亿图在软件上也可以反激活!