程序博客网 > 鲁班软件官网

Deep Learning for Nature Language Processing---第四讲(上)

来源：互联网发布：鲁班软件官网编辑：程序博客网时间：2024/06/16 06:40

分类的基础知识和标记notation

采样采集到的数据集:

这里写图片描述

x_i —输入. 例如 :单词(标号或向量vector),context windows,句子,文档等.

y_i —标签. 例如:情感,其他的单词,命名实体(参照NER),买卖决断,以后还会涉及到: multi-‐word sequences

分类 intuition

训练集:{x_i,y_i}^N_i=1

简单模型:

1.分类固定的二位word vector

2.使用逻辑回归 Logistic Regression

3.示意图如下(线性决策线linear decision boundary):

这里写图片描述

一般情况下的ML:假定x是固定的,只训练逻辑回归的权重W.即修改decision boundary:

数据集{x_i,y_i}^N_i=1的loss function:

这里写图片描述
其中N为数据集的大小

其中:

这里写图片描述

regularization

regularization后的loss function:

这里写图片描述

当有非常多的特征features时,或者对于后面需要用到的深度学习模型,regularization有利于防止overfitting.

这里写图片描述
其中x轴正向代表更多的迭代次数或者更”深”的模型,蓝线代表训练误差,红线代表测试误差test error.

Classification difference with word vectors

一般的机器学习模型中,θ 只包括W(注意θ 是一个列向量):

这里写图片描述

所以我们仅仅更新decision boundary:

这里写图片描述

而对于要训练权值W和X(word vector)的模型,既要更新word vector,也要更新decision boundary:

这里写图片描述

Loosing generalization by re-‐training word vectors(应该是训练word vector会失去模型的泛化特性的意思)

示例:训练电影评论情感的逻辑回归模型:

1.在训练集中,有”TV”和”telly”.测试集中有”television”

2.初始设置(pre-training)的word vectors如图:

这里写图片描述

3.但是在训练之后:

这里写图片描述

从以上两张图中可以发现:训练集trainning set中的word vectors已经发生了改变.总结出两个技巧:1.若训练集小,不要训练word vectors.2.若训练集足够大,最好也训练word vectors.

课件上关于word vectors的一些标记notation

word vectors矩阵L也叫作look-up table

Word vectors = word embeddings = word representations (mostly)

这里写图片描述

图片上的标记notation大多来自word2vec或者glove,从现在开始用x_word(words feature)类似的标记表示.

word vectors矩阵L通过与一个one-hot向量相乘得到一个word’s vector: x = Le (L为dV矩阵,e为V1向量)

Window classification(基于context window的分类)

主要思想:不同与只对单个单词分类,window classification通过给某个单词周围的词进行加窗处理,然后是分类这个单词

有一些加窗分类的方法.例如:对窗口里的所有word vector取平均,值,单这样会丢失必要的单词所在句子的位置信息.

idea:以下图的句子为例:给一个句子的最中间的词附上标签label.然后将之与周围单词的word vector联系起来,组成一个比x_Paris维度更高的的列向量x_window(注意是一个列向量):

这里写图片描述

Simplest window classifer:Softmax(最简单的加窗分类:softmax)

和以前用的softmax一样,令x=x_window即可:

这里写图片描述

Updating concatenated word vectors

标记:

这里写图片描述

一些技巧:

1.认真的定义变量,并且时刻注意其维度

2.记住连锁效应:

这里写图片描述

3.在对softmax进行求导时,先计算该输入对应的正确类别的倒数,在计算其他类别的倒数.

4.试着一次性对所有类别求导

5.学会自己定义新变量,对以后的运算很有用:

这里写图片描述

6.向量化:

这里写图片描述

7.一个简单的例子:下面运算后结果的维数是多少?

这里写图片描述

因为x是一个5 d*d的列向量(d为word vector的维数,参见加窗处理部分的word vectors矩阵L),所以对x进行求导后,结果的维数等于x的维数.

对context window里的所有单词的word vector进行求导,可以看成是对每个词的word vector求导的组合:

这里写图片描述

加窗的方法会帮助我们决断命名实体。比如对于句子：“museums in Paris are amazing”，我们就能学习到in后面可能是一个location。

0 0

鲁班软件官网

鲁班软件官网

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子新乡正商城正商城正商城二期九锦台正回购和逆回购的区别什么是正回购和逆回购正回购逆回购正回购和逆回购什么叫逆回购深市逆回购回购和逆回购回购逆回购 25的因数正团级正团级相当于什么级别正国颜正国图片颜正国的照片田正国公开恋情正国级退休后年薪千万中国有多少正国级干部猜看图猜瞎猜正处级调研员工资待遇建行副行长谁被降为正处级正大杯市场调查与分析大赛2018 正天丸正天丸多少钱一盒正天丸好用吗正天丸价格头痛正天丸正天丸报价偏头痛正天丸 999正天丸价格正天丸的价格正天丸多少钱正天丸生产厂家 999正天丸 999 正天丸正天丸怎么吃