2016-12-19
来源:互联网 发布:软件测试方案实例 编辑:程序博客网 时间:2024/05/21 21:48
今天主要的工作有以下几部分:
1. 熟悉运行word2vec_basic版本,tf.nn.nce_loss()函数返回的是batch的loss值,而因为词表太大不太适合做全局的softmax, 因此此处采取的是采样的方法,也就是经过一个正样本和多个随机采样的负样本来计算loss值,此处用的是sigmoid_cross_entropy_with_logits()函数,因此在计算交叉熵的时候是每一个维度分别看作一个二值的概率分布。
2. 在训练的时候代码中输入的embedding参数和输出的embedding并不是相同的参数,而是分开训练的。为了看两者的区别,分别做了两个不同的实验,一个是输入输出参数分别训练,结果如上方图所示,另外一个则共用参数,结果如下方图所示。
3. word2vec是更复杂版本的,有多线程和处理大规模数据的操作。需要注意的是tensorflow中op用c语言来写,在编译的时候会把相应的c语言代码编入相应的库中可以调用。
4. 看了短文本相似度一些最近的文章,大概了解到之前的利用知识库的方法主要先计算不同词在知识库中的距离,之后再计算短文本之间的距离。而利用深度学习的方法也类似,是把词表示向量,之后再用不同的方法来计算短文本的距离,比如(加权平均,求和,卷积,RNN)等等。
0 0
- 2016-12-19 19:17
- 2016-12-19
- 2016/12/19
- CVPR 2016-12-19
- [2016/12/19]kmp算法
- 2016/12/19学习工作总结
- 2016-12-27 19:04
- java日常笔记2016-12-19
- 2016年7月11日 12:19:26随笔
- 2016年1月12日19:16:08 PCB板调试日记(1)
- 最常见的算法,用PHP如何实现 (2016-06-12 19:53:17)
- 2016年12月19日学习总结----C语言程序优化
- 1613-3-傅溥衍 总结《2016年12月19日》【连续第八十天总结】
- 1622-5 孔富晨 总结《2016年12月19日》 【连续第80天总结】
- 2016-12-12
- 2016-12-12
- 2016/12/12 杂谈
- CVPR 2016-12-12
- 关于《半反去雾算法》一文的四宗罪。
- 机器学习决策树算法解决图像识别
- 一年去雾算法研究的总结。
- 动态规划_0-1背包问题
- 图像抠图算法学习 - Shared Sampling for Real-Time Alpha Matting
- 2016-12-19
- JDE 开发-函数
- 一种具有细节保留功能的磨皮算法。
- 由Photoshop高反差保留算法原理联想到的一些图像增强算法。
- $$和$BASHPID区别
- 最近下载的以及一些朋友共享的图像方面的论文备份。
- jax-ws 处理webservice
- 水下图像增强相关算法的一个简单小结。
- 利用联合双边滤波或引导滤波进行升采样(Upsampling)技术提高一些耗时算法的速度。