【论文阅读笔记】CVPR2015-Long-term Recurrent Convolutional Networks for Visual Recognition and Description
来源:互联网 发布:淘宝店运营方案 编辑:程序博客网 时间:2024/04/30 15:56
可能我这种分享方式并不利于其他同学找到相关内容,但是这样好方便啊,所以我就截图了。
这是一篇2015年的CVPR,但是后来改成了TPAMI,文章很经典,总结了整个序列模型的在三个任务上的应用。
本文是基于caffe框架实现的LSTM模型的训练,但是测试的时候,关于如何通过预测word来输入到LSTM模型,代替标注word,还未搞清楚
希望懂得同学告诉我inference的方法。
在这里正是留下这个问题:
当时用caffe做LSTM训练的时候,input_sentence通过编码输入到LSTM模型,然后生成predit_words,但是input_sentence和predict_words的维度都是(T, N, Dim),因此通过一个T个时刻的输入得到T个时刻的预测words。当测试的时候,是没有input_sentence的,所以无法输入到LSTM, 往往通过当前时刻的predict_word输入到下一时刻,代替原先的input_sentence word,可是按照blob是T时刻的,如何能一个一个time step的得到predict_word啊?
0 0
- 【论文阅读笔记】CVPR2015-Long-term Recurrent Convolutional Networks for Visual Recognition and Description
- long term recurrent convolutional networks for visual recognition and description
- Long-term Recurrent Convolutional Networks for Visual Recognition and Description
- Long-term Recurrent Convolutional Networks for Visual Recognition and Description
- [深度学习论文笔记][Video Classification] Long-term Recurrent Convolutional Networks for Visual Recognition a
- 【论文阅读笔记】Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition
- [caffe] Long-term Recurrent Convolutional Networks
- 论文阅读《Long-term Temporal Convolutions for Action Recognition》
- RCNN学习笔记(1):《Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition》论文笔记
- [论文阅读笔记]Two-Stream Convolutional Networks for Action Recognition in Videos
- [论文阅读笔记]Two-Stream Convolutional Networks for Action Recognition in Videos
- 【深度学习论文笔记】Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition
- 深度学习论文笔记-Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition
- 论文笔记 《Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition》
- 论文笔记|Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition
- Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition--SPP-net论文笔记
- 【论文笔记】Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition
- 深度学习论文笔记:Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition
- div层调整z-index属性无效原因分析及解决方法
- PAT 乙级 1004
- HashSet
- [51Nod 1816] 小C的二分图 口胡
- 浅析TF-GSC
- 【论文阅读笔记】CVPR2015-Long-term Recurrent Convolutional Networks for Visual Recognition and Description
- Codeforces 349C Mafia【二分+思维判定】
- 1001. 害死人不偿命的(3n+1)猜想 (15)
- 蛋白质结构预测(swiss-model,modeller )
- node中https请求
- 第七届蓝桥杯大赛个人赛省赛(软件类)A组第三题 方格填数
- 将web02项目配置上spring--applicationContext.xml
- Servlet中的HttpServletRequest
- C++四种类型转换机制