Teaching Machines to Read and Comprehend

来源：互联网发布：php获取手机号码编辑：程序博客网时间：2024/06/07 17:33

关键词

real natural language traning data, nerual model

Teaching Machines to Read and Comprehend
arXiv 2015.06.10 (published at NIPS 2015)

针对阅读理解缺乏大规模训练数据集，从CNN和Daily Mail获取数据，构建了相应的数据集。文章直接做document，关键点和总结用来做query。为了方便数据使用，将人名全部替换为”ent123”类似的样子。然后尝试利用神经网络模型解决机器阅读理解问题。
这里写图片描述

1.片段主义分析(Frame-Semantic Parsing)
即判断“who did what to him”。
2.词距判断（word distance Benchmark）

这里写图片描述
该模型重新设计LSTM公式，如下：

其中的的”||”表示连接两个向量，”|||”代表query和document的分隔符

这里写图片描述
u(query)由最后一个正向lstm输出和最后一个逆向lstm输出拼接而成。
r(document)的计算公式如下：

r是y*s的和累积。
g的计算公式如下：

这里写图片描述
u(query)由最后一个正向lstm输出和最后一个逆向lstm输出拼接而成。
r(document)计算公式如下：

与Attentive Reader区别是，每个query词都算一个r。
g计算公式如下：

这里写图片描述
文章提供新的较大的数据集，并且指出 CNN 语料要比 Daily Mail 阅读理解难度要低一些。

阅读全文

0 0