word2vct算法实现
来源:互联网 发布:centos软件安装目录 编辑:程序博客网 时间:2024/06/06 18:45
本篇文章主要是实现python 自然语言处理包 gensim 中用于词向量建模的 word2vec算法。
示例代码如下:
# encoding=utf-8import loggingimport sysfrom gensim.models import Word2Vecif __name__ == '__main__': logging.basicConfig(format='%(asctime)s : %(levelname)s : %(message)s', level=logging.INFO) if len(sys.argv) < 3: sys.exit(1) outputFile1, outputFile2 = sys.argv[1:3] sentences = [ "I think that most of us know by now that water is essential to our survival We’ve probably also all heard doctors say that drinking roughly eight glasses a day is ideal", "yoyoyo you go home now to sleep"] vocab = [s.encode('utf-8').decode().split() for s in sentences] #建立模型 model = Word2Vec(sentences, size=100, window=5, min_count=5, workers=4) #保存模型 model.save(outputFile1) model.save_word2vec_format(outputFile2, binary=False)
#测试模型# encoding='utf-8'import loggingimport sysfrom gensim.models import Word2Vecif __name__ == '__main__': logging.basicConfig(format='%(asctime)s : %(levelname)s : %(message)s', level=logging.INFO) if len(sys.argv) < 3: sys.exit(1) file, word = sys.argv[1:3] #从磁盘文件 file 加载模型 model = Word2Vec.load_word2vec_format(file, binary=False) print(model.most_similar(word))
更多内容可以查看官方文档
0 0
- word2vct算法实现
- 算法实现
- 算法实现
- 算法和算法实现
- 【算法】扑克发牌算法实现
- Java算法:二分法算法实现
- 《算法导论》算法实现收集
- 【算法】快排算法实现
- 算法导论中算法实现
- 《算法导论》Dijkstra算法实现
- 基数排序算法,讲解+算法实现
- 梅西迭代算法的实现
- 如何实现DES算法
- 银行家算法实现
- CRC算法与实现
- base64算法实现
- A*算法实现
- CRC算法的实现...
- 固态硬盘折腾记录
- 2017搬砖计划
- BZOJ1117: [POI2009]救火站Gas
- 使用Android 5.0的Camera v2拍照
- RHEL_6.8_X86_64安装Zabbix_2.4_Server端
- word2vct算法实现
- javascipt数组
- Lua配置表存储优化方案
- js浅复制与深复制的原理
- 接口测试的那些事(三)成果和心得
- Servlet的线程安全问题
- JavaScript的只继承于原型链
- 让Processing编辑器显示中文
- mysql5.7.xx on mswindows快速安装