多GPU环境下使用caffe遇到的问题
来源:互联网 发布:通信产业云计算峰会 编辑:程序博客网 时间:2024/04/28 20:00
两张GTX 1080 Ti,CPU为 AMD Ryzen 7 1700X,系统为 ubuntu sever 16.04需要nccl的支持。但是nccl的test跑不通,也就是两个GPU没办法相互协作!!!
在github上提交相关issue:
https://github.com/NVIDIA/nccl/issues/120
原来是CPU的设置问题,现已解决。
AMD的CPU解决方案:
输入 iommu命令发现输出中包含类似如下信息,说明AMD CPU的IOMMU被打开了。
[ 1.217752] iommu: Adding device 0000:44:00.0 to group 18[ 1.217762] iommu: Adding device 0000:44:00.2 to group 18[ 1.217980] AMD-Vi: Found IOMMU at 0000:00:00.2 cap 0x40[ 1.217984] AMD-Vi: Found IOMMU at 0000:40:00.2 cap 0x40[ 1.220552] perf: amd_iommu: Detected. (0 banks, 0 counters/bank)
输入sudo vim /etc/default/grub
按下述编辑:#GRUB_CMDLINE_LINUX="" <----- Original commentedGRUB_CMDLINE_LINUX="iommu=soft" <------ Change
然后更新GRUB:sudo update-grub
最后重启:sudo reboot
多GPU已经可以正常使用!
阅读全文
0 0
- 多GPU环境下使用caffe遇到的问题
- 编译gpu版caffe遇到的问题
- win10下caffe+gpu使用问题总结
- Caffe下多GPU性能问题
- Caffe训练mnist数据遇到的问题(GPU版)
- ubuntu 16.04 安装caffe GPU版本时遇到的问题
- Ubuntu 16.04安装使用--Ubuntu16.04下基于Docker的Caffe-GPU版本环境搭建总结
- Ubuntu环境下安装GPU版本的caffe
- [caffe使用]caffe使用中可能遇到的问题总结
- ubuntu下配置caffe环境遇到的一些问题及解决方法(备忘)
- 使用Caffe预测遇到的问题
- 使用Caffe预测遇到的问题
- caffe 使用中遇到的问题
- Caffe使用中遇到的问题
- 使用caffe ssd中遇到的问题
- OpenCV中gpu下使用cascade classifier遇到问题的解决方案
- 使用PCL::GPU::遇到问题
- 解决win10下配置matlab接口的GPU版Caffe时常遇到的一些错误
- nginx的优先匹配规则
- 关于hbase修复
- kali中怎么安装Nessus
- IntelliJ IDEA Ultimate 2017激活方法
- Nginx Location配置总结
- 多GPU环境下使用caffe遇到的问题
- 常用adb调试命令
- Average UVA
- 软件课设,学生信息与成绩管理系统
- Java8多线程的启动方法
- update/upgrade
- leetcode习题解答:72. Edit Distance
- syslog4j消息内遇中文,消息内容不完整解决办法
- 吴恩达课程