[机器学习入门] 李宏毅机器学习笔记-30 (Sequence Labeling Problem part 2 ;结构化预测-序列标记 part 2)
来源:互联网 发布:豆瓣电影推荐算法 编辑:程序博客网 时间:2024/05/17 02:47
[机器学习入门] 李宏毅机器学习笔记-30 (Sequence Labeling Problem part 2 ;结构化预测-序列标记 part 2)
上接 part 1
Sequence Labeling Problem
Outline
CRF
CRF同样也要描述P(x,y),P与图中式子成正比。
P(x,y) for CRF
CRF与HMM其实并没有那么不同,它们的model是一样的,只是在training上有所不同。
紫色部分:如果有10个可能的词性tag,世界上有10000个word的话,s就有10个不同的可能,t就有10000个不同的可能,紫色部分就是Summation 10*10000项,里面每一项就是word t被标示成tag s这件事在x,y这对pair中总共出现的次数。
红色部分:根据现在的model,word t 被取 tag s 的几率取log。
为什么可以做这样的转化呢?举个栗子。
所以对其他项也可以做几乎一样的转化。
如此这般,发现可以吧logP(x,y)写成一大堆两项的相乘。
有个地方需要额外注意一下,对应某个纬度的weight ,w是可以与HMM里面的几率相对应的,而且是可以通过exp()做转化的,因为没办法保证所求出来的exp是小于1的,所以不能说相等,而说他们成正比。
Feature Vector
就直接记住,CRF的几率就是一个exp下,一个weight 和 一个feature vector的inner products,那么这个feature ��(x,y)长什么样子呢?是由两个部分组成的。
part1,所有词性与词汇的pair,维度就是(词性tag*所有的词汇),特点是维度非常大,但有值的地方不多。
part 2,词性之间相接的次数,维度就是(词性tag*词性tag+2*词性tag),其中2*词性tag是与start与end的pair。
CRF比HMM厉害在于可以自己定feature vector,非常灵活。
CRF – Training Criterion
那么CRF该怎么train呢?
CRF – Gradient Ascent
用gradient ascent来求解,与gradient descent非常像。
CRF - Training
这里解释一下,绿色框框,s与t 这个pair,在我们的training data中出现的次数越高,对应的weight w 的值就越大。
黄色框框,如果s与t 这个pair,不只在正确在任意一个xy组合中出现的次数都很大的话,就应该把w减小。
CRF – Inference
把w求出来,就可以做inference
CRF v.s. HMM
CRF - Summary
- [机器学习入门] 李宏毅机器学习笔记-30 (Sequence Labeling Problem part 2 ;结构化预测-序列标记 part 2)
- [机器学习入门] 李宏毅机器学习笔记-29 (Sequence Labeling Problem part 1;结构化预测-序列标记 part 1)
- [机器学习入门] 李宏毅机器学习笔记-31 (Sequence Labeling Problem part 3 ;结构化预测-序列标记 part 3)
- [机器学习入门] 李宏毅机器学习笔记-27(Structured SVM part 2;结构化支持向量机 part 2)
- [机器学习入门] 李宏毅机器学习笔记-36(Ensemble part 2;集成方法 part 2)
- [机器学习入门] 李宏毅机器学习笔记-28 (Structured SVM part 3 ;结构化支持向量机 part 3)
- [机器学习入门] 李宏毅机器学习笔记-22(Transfer Learning part 2;迁移学习 part 2)
- [机器学习入门] 李宏毅机器学习笔记-19 (Deep Generative Model-part 2:深度生成模型-part 2)
- [机器学习入门] 李宏毅机器学习笔记-33 (Recurrent Neural Network part 2;循环神经网络 part 2)
- [机器学习入门] 李宏毅机器学习笔记-35(Ensemble part 1;集成方法 part 1)
- [机器学习入门] 李宏毅机器学习笔记-26(Structured Support Vector Machine part 1;结构化支持向量机part 1)
- [机器学习入门] 李宏毅机器学习笔记-21(Transfer Learning part 1 ; 迁移学习 part 1)
- [机器学习入门] 李宏毅机器学习笔记-18 (Deep Generative Model-part 1:深度生成模型-part 1)
- [机器学习入门] 李宏毅机器学习笔记-20 (Deep Generative Model-part 3:深度生成模型-part 3)
- [机器学习入门] 李宏毅机器学习笔记-32 (Recurrent Neural Network part 1;循环神经网络 part 1)
- [机器学习入门] 李宏毅机器学习笔记-34 (Recurrent Neural Network part 3;循环神经网络 part 3)
- [机器学习入门] 李宏毅机器学习笔记-25(Sturctured Linear Model;结构化预测-线性模型)
- Stanford 机器学习练习 Part 2 Logistics Regression
- githup 本地仓库存在,推送到远程项目上
- 记录neo4j图形数据库关系线的遍历
- React DOM-Diff算法
- 一个匹配数字的正则表达式(带详细解释)
- PictureControl控件加载图片
- [机器学习入门] 李宏毅机器学习笔记-30 (Sequence Labeling Problem part 2 ;结构化预测-序列标记 part 2)
- 欢迎使用CSDN-markdown编辑器
- Linux 开启端口命令
- 控制反转(IoC)与依赖注入(DI)
- java中类加载的过程01
- POJ
- c++历史版本
- TCP/IP体系结构
- 扩展阅读 两个优秀的论坛(吾爱破解/看雪)