NLP+2vec︱认识多种多样的2vec向量化模型
来源:互联网 发布:删除数据库的sql语句 编辑:程序博客网 时间:2024/06/08 04:27
来自于github一位博主的整理,好多都没有看到过+还有我一直期待去研究的。
github:https://github.com/MaxwellRebo/awesome-2vec
1、word2vec
耳熟能详的NLP向量化模型。
Paper: https://papers.nips.cc/paper/5021-distributed-representations-of-words-and-phrases-and-their-compositionality.pdf
Java: http://deeplearning4j.org/word2vec
C++: https://github.com/jdeng/word2vec
Python:
https://radimrehurek.com/gensim/models/word2vec.html
https://github.com/danielfrg/word2vec
2、doc2vec
Paper: https://cs.stanford.edu/~quocle/paragraph_vector.pdf
Python: https://radimrehurek.com/gensim/models/doc2vec.html
word2vec模型对词向量进行平均处理,我们仍然忽略了单词之间的排列顺序对情感分析的影响。即上述的word2vec只是基于词的维度进行”语义分析”的,而并不具有上下文的”语义分析”能力。
作为一个处理可变长度文本的总结性方法,Quoc Le 和 Tomas Mikolov 提出了 Doc2Vec方法。除了增加一个段落向量以外,这个方法几乎等同于 Word2Vec。和 Word2Vec 一样,该模型也存在两种方法:Distributed Memory(DM) 和 Distributed Bag of Words(DBOW)。DM 试图在给定上下文和段落向量的情况下预测单词的概率。在一个句子或者文档的训练过程中,段落 ID 保持不变,共享着同一个段落向量。DBOW 则在仅给定段落向量的情况下预测段落中一组随机单词的概率。
(参考:Algorithm & NLP] 文本深度表示模型——word2vec&doc2vec词向量模型 )
3、tweet2vec
Paper: https://arxiv.org/abs/1605.03481
Python: https://github.com/bdhingra/tweet2vec
一些社交文本中的语言结构跟书面语大不相同,所以作者别出心裁的特意做了一个基于字符组合的模型,其可以基于整个微博环境下复杂、非正常语言的字符串中学习到一种向量化的表达方式。
4、batter-pitcher-2vec
Python: https://github.com/airalcorn2/batter-pitcher-2vec
5、illustration-2vec
Python: https://github.com/rezoo/illustration2vec
6、lda2vec
Paper: https://arxiv.org/pdf/1605.02019v1.pdf
Slideshare: http://www.slideshare.net/ChristopherMoody3/word2vec-lda-and-introducing-a-new-hybrid-algorithm-lda2vec-57135994
Python: https://github.com/cemoody/lda2vec
将LDA与word2vec相结合,LDA是我比较在意的研究方向,这个模型很早提出,不过应用地倒是不多。
lda2vec the topics can be ‘supervised’ and forced to predict another target.
7、sentence2vec
Python: https://github.com/klb3713/sentence2vec
8、wiki2vec
Java/Scala: https://github.com/idio/wiki2vec
9、topicvec
Paper: http://bigml.cs.tsinghua.edu.cn/~jun/topic-embedding.pdf
Python: https://github.com/askerlee/topicvec
10、entity2vec
Python: https://github.com/ot/entity2vec
Paper: http://www.di.unipi.it/~ottavian/files/wsdm15_fel.pdf
11、str2vec
Python: https://github.com/pengli09/str2vec
12、node2vec
Paper: https://arxiv.org/abs/1607.00653
Page: https://snap.stanford.edu/node2vec/
Python: https://github.com/aditya-grover/node2vec
可见:笔记︱基于网络节点的node2vec、论文、算法python实现
13、item2vec
Paper: https://arxiv.org/abs/1603.04259
14、author2vec
Paper: https://www.microsoft.com/en-us/research/publication/author2vec-learning-author-representations-by-combining-content-and-link-information/
15、playlist-to-vec
Python: https://github.com/mattdennewitz/playlist-to-vec
16、sense2vec
Paper: https://arxiv.org/abs/1511.06388
17、med2vec
Paper: https://arxiv.org/abs/1602.05568
Python: https://github.com/mp2893/med2vec
SCODE Word Embeddings using Substitute Words
Python: https://github.com/ai-ku/wvec
18、game2vec
Python: https://github.com/warchildmd/game2vec
19、paper2vec
Paper: https://arxiv.org/pdf/1703.06587.pdf
转载自:http://blog.csdn.net/sinat_26917383/article/details/69666596
- NLP+2vec︱认识多种多样的2vec向量化模型
- NLP+2vec︱认识多种多样的2vec向量化模型
- vec
- if( vec.end() == vec.erase( vec.begin() , vec.end() ) )不一定为真!
- 縮寫(uchar、ushort、Vec)
- VEC-C基础
- VEC-C直方图
- VEC-C滑窗
- Rust: rev()、Vec<>、其它
- Rust : range,&[],vec,array中元素的类别
- Rust: 如何交换Vec类型中数据的位置?
- Cocos2d-x中的Vec类
- const vector<int> vec(10)
- Rust: Vec用法及其它
- 自己创建一个新的Vec类用来实现vector的功能
- 在VC6中,如何查看以下代码中vec里的内容?
- VEC-C之VPLD的rel与abslute两种寻址模式理解源码
- OpenCV Tutorial: 縮寫(uchar、ushort、Vec)
- 【linux】Ubuntu上的防火墙iptables的基本配置与使用
- python查看系统启动项
- PHP反射与代理模式
- python修改IE注册表
- 常用的sublime text 3插件
- NLP+2vec︱认识多种多样的2vec向量化模型
- mysql的sql优化
- MVP架构分包+OkHttp网络请求+RecyclerView展示数据
- spirng boot+dubbo+zookeeper整合出现的问题
- Jackson的使用总结
- python的系统调用
- 小壁虎之EFM32--小试牛刀
- QT 一个类调用另一个类中的方法 (样式表例子)
- Tensorflow实战学习(四十四)【TF.Contrib组件,统计分布,Layer,性能分析器tfprof】