n-gram重探 Q&A
来源:互联网 发布:linux虚拟机建立文件夹 编辑:程序博客网 时间:2024/06/06 04:18
虽然之前一直用这个最基本的模型,但今天发现自己对这个模型确实不够熟悉,因此,对此参考了不少文献,以问答的形式进行了整理。
1、n -gram 的训练是什么?训练的参数是什么?
对于模型某条字符串的计算公式是:
假设在一个模型里,单词数量为
说完了参数,我们说下训练。对于训练集, 我们对以上参数进行最大似然估计(MLE),估计方法如下:
2、n -gram 这里的MLE是怎么得出来的?
统计次数就代表了它的最大似然估计,是因为对于
这也就是刚好是统计次数,count部分。
3、n -gram 既然使用了MLE,那能不能引入最大后验估计(MAP)或者贝叶斯估计?
答案是可以的。我们问题1里提到的参数,如果看成是一个随机变量,那么我们可以引入先验分布,使用贝叶斯公式。
最大后验估计:
贝叶斯估计:
正如问题2所说,
在狄利克雷先验下的最大后验估计是:
等价于加m平滑的最大似然估计,先验可以通过大量通用语料训练,然后使用小规模的领域专用数据进行计算贝叶斯最大后验估计。
- n-gram重探 Q&A
- YUM Q n A
- n-Gram
- N-gram
- N-gram
- n-gram
- n-gram
- q-gram 字符串相似
- N-gram模型
- N-gram模型
- N-gram算法
- N-gram模型
- N-gram模型
- N-gram模型
- N-Gram学习笔记
- N-Gram的数据结构
- N-gram模型
- N-gram模型
- 实习这些事
- bzoj 3148: [Ctsc2013]没头脑和不高兴 数学&线段树
- Kafka Wire Protocol
- eclipse快捷键大全
- 大象Thinking in UML读书笔记☞ 第一章
- n-gram重探 Q&A
- Linux CentOS6.5下编译安装MySQL 5.6.16
- js创建子窗口,并通过子窗口操作父窗口的对象
- JAVA之字符串和Unicode码互转_中文转换为Unicode
- Java 连接Oracle的问题
- MyEclipse中的JDK环境注意的几个地方
- Hibernate框架入门(学习笔记)
- 数据结构实验之栈六:下一较大值(二)
- c++链式队列的实现