Coursera自然语言处理 Week4 笔记
来源:互联网 发布:12年伤感网络歌曲大全 编辑:程序博客网 时间:2024/05/21 21:50
前一周讲的Pure PCFG是完全和语义没有关系的,但是很多的“歧义问题”放在一个特定的语境中,就不会产生歧义的,所以这个语义还是很重要的。第四周就讲了如何把这种语义放进Pure PCFG中去。
1. Pure PCFG的缺点
看下面这个例子:
这棵Parsing Tree由7条规则组成,看其中的第5条规则“NNP
再比如说下面这个例子中:
唯一不一样的地方就是选择”
总结:lexical information(语义信息)是重要的,我们大家需要它!
2. Lexical PCFG理论
Lexical PCFG通过向规则中加入“head”来添加语义信息。
“head”的意思就是这个词组中最重要的部分,如果只有一个单词,那就是这个单词本身,比如说:
就这样,由下至上,反向传播上去,直到root处结束。
于是就有了下面这个Pure PCFG 和 Lexical PCFG的对比图:
2.1 模型搭建
于是,我们的模型搭建如下:
比如在上面的这棵树中,有8条rules和一个root:
于是整棵树的概率计算如下:
2.2 参数估计
于是,这个模型的唯一参数就是
令
于是有:
于是这个参数转变成了两个小参数
然后,
其中,
其中,
可以看到,这里参数估计的时候,融合了non-lexical部分(
3. Lexical PCFG实现
这里依旧是使用“动态规划”来实现,唯一不通的就是,参数的计算,除此之外,整个算法没有什么不同。
- Coursera自然语言处理 Week4 笔记
- Coursera自然语言处理 Week1 笔记
- Coursera自然语言处理 Week2 笔记
- Coursera自然语言处理 Week3 笔记
- Coursera机器学习 Week4 笔记
- Coursera Machine Learning Week4 学习笔记
- 【Coursera Machine Learning】 Week4 学习笔记
- [笔记]Coursera Machine Learning Week4,5
- coursera-android-week4-4
- 《python自然语言处理》笔记
- 自然语言处理-手写笔记
- 自然语言处理学习笔记
- 自然语言处理学习笔记
- coursera-android-week4-1 views
- Coursera机器学习 week4 assignment
- 自然语言处理学习笔记(001)
- 自然语言处理学习笔记(002)
- 自然语言处理学习笔记(003)
- 先进的图表Web部件Nevron Chart for SharePoint发布v2016.1版本丨附下载
- 再出发
- 先码后看 spring aop切入点表达式 侵立删
- BZOJ-1588: [HNOI2002]营业额统计 (set查找前驱后继 splay练习题)
- 随机森林(Random Forest)(二)
- Coursera自然语言处理 Week4 笔记
- css行高line-height的一些深入理解及应用
- 登录 SQLPLUS
- 總結——關於2017 10 11測試的分析總結
- Shiro Jdbcrealm
- VMware虚拟机磁盘文件vmdk单文件转多文件相互转换
- Android Tab导航
- 论文投稿
- 【LeetCode算法练习(C++)】Generate Parentheses