反卷积网络在文本表征方面的应用
来源:互联网 发布:海湾编程软件 下载 编辑:程序博客网 时间:2024/05/16 06:18
这篇博客主要参考了2017年NIPS会议的paper《Deconvolutional Paragraph Representation Learning》。首先值得一提的是,这篇文章是反卷积网络在文本领域的第一篇应用,(反卷积网络在2010年在paper《Deconvolutional Networks》中提出的,主要用于图像处理领域,当一个原始的图像经过卷积和反卷积操作后,就能够提取出图像中的边缘特征)。
读这篇博客之前首先要清楚反卷积操作和卷积操作的具体细节,其实说起来很简单:反卷积操作就是卷积操作的反向过程。如果非常理解卷积操作的话,应该很清楚一个输入是如何通过卷积的特殊方式转化成输出形式的,那么反卷积就是把输出和输入颠倒过来,同时保持输入和输出对应单元元素的对应关系不变,这就是反卷积过程。如果一个原始的输入信号通过一层一层的卷积操作最终变成了一个向量的形式,同样可以通过对称的反卷积方式一层一层的变换回去再变成和原始输入信号同等维度的输出。
这篇论文的整体架构如下所示:
从图中可以看出这个架构由两个大部分组成,分别是Convolution Layers和Deconvolution Layers两个部分组成,同时不难看出这两个部分中的卷积和反卷积操作设置关于中间线成镜面对称。输入层的矩阵表征的是一个句子,句子在经过了padding之后长度为60,词向量的维度是300,在经过了两层卷积之后变成了500维的lantent向量,最后在经过对称的反卷积操作重新扩展回去,变成和输入层一样维度的矩阵。在这个过程中有一个细节需要注意,就是在输入的词向量和输出的词向量都进行了归一化的处理,这样对于损失函数来说每一个词语的权值都大致是相当的,它的归一化方式是以每一个词语为单位,即使得每一个词向量的模为1。(反正这点我有一点点的质疑,不应该以词向量的每一个维度为单位进行归一化更合理吗?这个以后可以继续进行探究。)
从这个过程中,我们不难看出,第一阶段的卷积操作完成了对原始句子的编码操作(Encoder),第二阶段的反卷积操作完成了对原始句子的解码操作(Decoder),我们的目标就是要使得输入值和输出值越相似越好,那么就有如下的损失函数:
其中
可以看出
到目前为止整个网络的无监督部分就已经讲解完了,作者还那这个基于反卷积的Decoder和基于RNN的Decoder进行了比价,结论就是:这个基于反卷积的Decoder在生成信号的时候是一下子直接生成了所有的输出信号,这些信号都是基于那个latent vector
下面就以文本分类为例,来说明一下如何利用上述无监督训练的网络来帮助进行文本的分类训练。因为在进行文本分类的时候,是需要label数据进行训练的,但是往往有label的数据非常有限,如何利用刚才无监督的网络进行增强,下面就是一种解决方案:
把上述卷积-反卷积架构中的latent vector
其中
- 反卷积网络在文本表征方面的应用
- 反卷积在神经网络可视化上的成功应用
- 反卷积网络概念及其于目标检测中的应用
- 应用到文本领域的卷积方法
- 深度学习卷积网络中反卷积/转置卷积的理解 transposed conv/deconv
- 余弦相似度的计算方法及在文本相似度方面的应用
- 文本反垃圾的原理和应用
- fcn的反卷积
- GAN的反卷积
- ANSI控制码在输出有颜色文本方面应用
- 应用图在地图方面的应用
- 神经网络入门(二)卷积网络在图像识别的应用
- 人工智能从入门到精通(15)-卷积网络在数字识别的应用
- 卷积与反卷积的理解
- 深度卷积网络在计算机视觉中的应用研究综述
- 卷积神经网络在自然语言处理的应用
- 卷积神经网络在自然语言处理的应用
- 卷积神经网络在自然语言处理的应用
- 内存溢出应对:把图片固定大小赋值给bitmap
- c++11 中的 move 与 forward
- 网卡驱动程序实践
- Java | 向下转型与运行时类型识别
- 产品经理内功修炼——"动起来"的产品
- 反卷积网络在文本表征方面的应用
- Java:String、StringBuffer和StringBuilder的区别
- Java集合框架
- 爬取酷狗top500
- linux下系统启动时,几个配置文件 /etc/profile、~/.bash_profile 等几个文件的执行过程,先后顺序
- Java集合框架上机练习题
- java 聚合工程同级相互引入函数问题。interface无法引入与父类相同级别的common中的函数
- 20170904_chr_filter 初试过滤器(集合模拟数据库添加图书)
- Windows下qt的环境配置及运行一个c++"hello world"实例详细步骤