程序博客网 > 济南知远心理咨询中心

[dialog system] 阅读笔记

来源：互联网发布：济南知远心理咨询中心编辑：程序博客网时间：2024/06/15 00:34

首选吐槽一下csdn, 博客title的长度竟然有限制，一篇论文题目都放不下。试了下简书，完全无障碍。

Ref

Building End-To-End Dialogue Systems Using Generative Hierarchical Neural Network Models,Iulian V. Serban, Alessandro Sordoni, Yoshua Bengio, Aaron Courville, Joelle Pineau,2016

Introduction

open-domain, large corpus, generative model,non-goal-driven
采用层次end2end 架构(HRED)，一层对token-level 建模，一层对sentence-level 建模。sentence-level 相当于考虑了会话历史信息，并作为context 应用到decode 端。
improved by bootstrapping and pretrained word embeddings
三轮对话(three consecutive utterances)
data set: 电影字幕（movie scripts）

problem

标准的seq2seq 模型在dialog system 中对上下文信息的依赖有限，本文提出一种能够对句子和上下文同时建模的分层网络，来实现多轮对话。

model

HRED

对conversation 进行分层，每个 conversation 可以看作是utterance的序列，同样每个utterance 可以看作是token的序列。
encoder RNN 将每个 utterance 编码为一个dense vector( utterance vector),其中utterance vector 为 encode RNN 的最后一个隐藏状态；
context RNN 对已经得到的utterence vector 进行编码。这样在解码生成response 是就可以利用会话的历史信息；
context RNN 的目的是希望speakers们基于相同的会话背景（如topics, concepts）进行会话，这样才能产生有意义的会话；
bootstrapping 。首先在大语料上训练word embedding，然后在{Q,A}对大语料上预训练模型

comment

同样，这篇论文与[dialog system]阅读笔记 - 2016__A Persona-Based Neural Conversation Model一样，考虑的重点是将历史会话信息应用到解码中，仅使用了标准的decode RNN, 没有进一步加入atttention mechanism；可以效仿阅读笔记 - 2015__Neural Responding Machine for Short-Text Conversation 一文所述方法，将context representation 与各个注解hj 拼接，也就成了加入注意力机制的HRED。
HRED相对于标准的seq2seq模型的提高并不明显，反而bootstrapping 的作用更加明显。

阅读全文

0 0

济南知远心理咨询中心

济南知远心理咨询中心

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子伏立康唑针剂阿奇霉素针剂的作用功效羊胎素针剂价格透明质酸针剂韩国针剂面膜左氧氟沙星针剂说明书针剂去皱小钟琴一台多少钱小钟琴介绍小钢炮车小刚炮汽车小钢炮大众小钢炮多少钱国产小钢炮小钢炮价格雷诺小钢炮雷克萨斯小钢炮铃木小钢炮小钢炮手机日产小钢炮福克斯小钢炮雪佛兰小钢炮小钢炮a4纸小钢炮耳机小钢炮热敏纸小钢炮保健品 polo小钢炮小钢炮纸佳能小钢炮大众小钢炮报价小钢炮镜头小钢炮尚酷保健品小钢炮小钢炮车型推荐小钢炮是谁汽车高尔夫钢炮旅行版高尔夫敞篷高尔夫 2012高尔夫小钢炮是什么意思