机器学习torch代码训练过程中常见bug解决经验
来源:互联网 发布:淘宝店推广引流的技巧 编辑:程序博客网 时间:2024/06/05 12:44
1.out of memory
THCudaCheck FAIL file=/tmp/luarocks_cutorch-scm-1-3726/cutorch/lib/THC/generic/THCStorage.cu line=66 error=2 : out of memory
In 20 module of nn.Sequential:
……torch/install/share/lua/5.1/cudnn/Pointwise.lua:63: cuda runtime error (2) : out of memory at /tmp/luarocks_cutorch-scm-1-3726/cutorch/lib/THC/generic/THCStorage.cu:66
stack traceback:
[C]: in function 'resizeAs'
解决:
linux 使用nvidia-smi -l 查看当前内存使用情况
(1)有可能机器本身的内存不够,譬如只有2G,实际vgg网络一般都需要超过2G的内存,所以可以使用cpu的方式,或者查看使用这个方式http://liipetti.net/erratic/2016/03/21/using-nin-imagenet-conv-in-neural-style/
(2)机器本身内存6G,基本够用,程序运行过程中使用内存过大,有可能是使用训练的图片比较大,size更改小点
(3)batchSize设置比较大,有些机器内存不够。
阅读全文
0 0
- 机器学习torch代码训练过程中常见bug解决经验
- Torch中多GPU运行代码学习
- 机器学习算法在训练过程中参数保存
- 利用邮箱监督机器学习训练过程
- 机器学习中常见的字母解析及MarkDown代码
- Torch经验
- 代码-Torch7-学习torch-tutorials
- opencv2机器学习经验记录之cascade分类器训练
- Torch 中 ipGaussian 和 ipWeighedGaussian 的 BUG。
- RecyclerView开发中不常见bug解决
- Magento学习过程中常见代码资料整理
- 机器学习中常见算法
- iOS编程学习过程中常见bug记录-持续记录
- 项目中一个Bug的解决过程
- 机器学习算法在训练过程中保存参数
- 常见css bug解决
- torch代码学习系列一:age_gender
- 【深度学习】torch使用nngraph构建网络并训练
- POJ 1313 Booklet Printing 笔记
- 直接插入排序与希尔排序
- 第一次写博客
- 性能测试中用LambdaProbe监控Tomcat
- 百度的科学计算器(简单)
- 机器学习torch代码训练过程中常见bug解决经验
- laravel(二)-目录结构
- (78)自定义事件
- 跨页面的操作
- ajax解析Json数据的方法
- 监控JAVA应用的好工具javamelody
- Android中自己实现App一打开判断是否有更新,并通过依赖AutoInstaller实现自动更新
- codeforces 347 c Alice and Bob(博弈 && 数学)
- win10安装时提示 “我们无法创建分区也找不到现有的分区”