机器翻译第一步--词向量的生成与保存
来源:互联网 发布:汉密尔顿 知乎 喜剧 编辑:程序博客网 时间:2024/05/20 16:13
最近在看斯坦福大学机器翻译的开源代码,琢磨着把代码稍微改动一下,做成中文到英文的翻译。机器翻译的第一步是将词转化成词向量。斯坦福大学没有做中文的转化,我只好自己想办法。
我用的是斯坦福大学的nmt-matlab-master代码,显然这是用matlab编写的。matlab中没有直接将词转换成词向量的程序可用,Python倒是有一个:word2vec。所以我就先用Python生成,存储为.mat类型的文件,再应用到matlab上。
下面是代码:
from gensim.models import word2vec import logging logging.basicConfig(format='%(asctime)s:%(levelname)s: %(message)s', level=logging.INFO) sentences =word2vec.Text8Corpus(u"F:\chinese1w.txt")model =word2vec.Word2Vec(sentences, size=200) model.save(u"F:\分词.mat")
对,就是这么简单。
0 0
- 机器翻译第一步--词向量的生成与保存
- 向量的生成
- RNN与机器翻译
- Matlab向量的生成方法
- 机器翻译之Facebook的CNN与Google的Attention
- 基于RNN的语言模型与机器翻译NMT
- 基于RNN的语言模型与机器翻译NMT
- 使用knowledge-based方法提升词向量的生成质量
- 机器翻译研究的展望
- 机器翻译的局限
- 机器翻译系统的搭建
- 机器翻译的前世今生
- 模仿的机器翻译
- 神经网络机器翻译的实现
- 机器翻译
- 机器翻译
- 机器翻译
- 机器翻译
- redis 有序集合
- 制作图标字体(详解),使用工具icomoon
- day11-cookie&session
- Android View 基础知识
- opencv︱opencv中实现行人检测:HOG+SVM(二)
- 机器翻译第一步--词向量的生成与保存
- eclipse中关于SVN插件的安装和配置方法
- 图片处理(防止内存溢出)
- 项目的访问路径问题
- 【C++primer学习日记】2.1基本内置类型
- LeetCode 547 Friend Circles(并查集)
- maven依赖中的scope使用
- 1016. Phone Bills (25)
- 计算机网络2-网络应用