SRILM 语言模型训练工具
来源:互联网 发布:企业淘宝费用是多少 编辑:程序博客网 时间:2024/04/28 04:28
1,下载
2,安装
make SRILM=$PWD3,配置
将bin和bin/i686-m64添加到PATH环境变量中
4,测试
./ngram-count -help
5,海量语料训练
由于对于大规模语料进行语言模型的训练,经常会导致内存问题。
经过测试,用srilm处理一个3G的语料,训练3元语言模型,32G内存根本就不够用。
解决方案:把文件给分开了,然后分别算词频并merge起来,做成一个语言模型,具体参见。
操作步骤:
1 把文件给分割开,放在一个目录下,然后生成一个文件名列表文件,如filelist ,一般使用按行分割的形式,split -l100 test.txt out
2
3
参考文档:srilm 语言模型的内存问题
- SRILM---语言模型训练工具SRILM详解
- 语言模型训练工具SRILM
- SRILM 语言模型训练工具
- 语言模型训练工具SRILM
- 语言模型训练工具SRILM详解
- 语言模型训练工具SRILM详解
- 语言模型训练工具SRILM详解
- 语言模型训练工具:SRILM的使用
- SRILM语言模型工具
- Mac OSX下安装配置SRILM语言模型训练工具
- 【Natural Language Processing】语言模型训练工具Srilm的安装及使用简介
- SRILM使用之训练无平滑语言模型
- srilm建立语言模型
- SRILM语言模型格式解读
- 语言模型-SRILM(1) 安装
- SRILM使用之用平滑Katz回退训练语言模型
- 利用开源工具搭一套汉英翻译系统(三):语言模型工具SRILM
- SRILM--语言模型--N-Gram基本介绍
- VS2008:无法连接到ASP.NET Development server的解决办法
- ssh建立连接缓慢的解决方法
- Introducing iOS Boilerplate A base template for iOS apps
- Myeclipse 连接SQL Server
- android弹出对话框大全
- SRILM 语言模型训练工具
- spring mvc 之注释版
- poj 3117(简单数学题) World Cup
- coursera NLP学习笔记之week1最小编辑距离计算
- ssh 有时候遇到的问题;
- 如何判断链表是否有环的存在
- Tomcat配置文件Host元素属性介绍
- C++拷贝构造函数详解
- 里程碑图、横道图、项目进度网络图比较