matlab中cuda编程中分配grid和block dimension的时候的注意事项
来源:互联网 发布:base64 java 保存图片 编辑:程序博客网 时间:2024/06/05 15:54
这两天在MATLAB里面用CUDA, 结果老是不对, 找了半天才发现, 原来是分配的问题
所以提醒小伙伴们, 分配的时候先看下你的GPU性能
>> gpuDeviceans = CUDADevice (具有属性): Name: 'Quadro K2000' Index: 1 ComputeCapability: '3.0' SupportsDouble: 1 DriverVersion: 7.5000 ToolkitVersion: 7.5000 MaxThreadsPerBlock: 1024 MaxShmemPerBlock: 49152 MaxThreadBlockSize: [1024 1024 64] MaxGridSize: [2.1475e+09 65535 65535] SIMDWidth: 32 TotalMemory: 2.1475e+09 AvailableMemory: 1.6566e+09 MultiprocessorCount: 2 ClockRateKHz: 954000 ComputeMode: 'Default' GPUOverlapsTransfers: 1 KernelExecutionTimeout: 1 CanMapHostMemory: 1 DeviceSupported: 1 DeviceSelected: 1
MaxThreadsPerBlock: 1024
其中这段话关键, 如果你是block是二维的话,那么你的threadsPerBlock.x * threadsPerBlock.y 不能大于1024.
我用dim3 threadsPerBlock(256, 256); 试了半天, 最终返回的矩阵都是全零矩阵, 所以希望大家注意
0 0
- matlab中cuda编程中分配grid和block dimension的时候的注意事项
- CUDA的Threading:Block和Grid设定
- CUDA的Threading:Block和Grid设定
- CUDA 的 Threading:Block 和 Grid 设定
- CUDA的Threading:Block和Grid设定
- CUDA的Threading:Block和Grid设定
- CUDA 的 Threading:Block 和 Grid 的設定與 Warp
- CUDA 的 Threading:Block 和 Grid 的設定與 Warp
- CUDA 的 Threading:Block 和 Grid 的設定與 Warp
- CUDA: Threading的Block和Grid的設定與 Warp
- CUDA: Threading的Block和Grid的設定與 Warp
- CUDA 的 Threading:Block 和 Grid 的設定與 Warp
- CUDA中grid、block、thread、warp与SM、SP的关系
- [原]CUDA中grid、block、thread、warp与SM、SP的关系
- CUDA中grid、block、thread、warp与SM、SP的关系
- CUDA中grid、block、thread、warp与SM、SP的关系
- CUDA:一维、二维的grid、block的核函数线程分配
- matlab中grid的用法
- ARM ELF 镜像结构
- SQLite
- Django模板系统(非常详细)
- 在Ubuntu系统中安装wxpython
- Simplify Path
- matlab中cuda编程中分配grid和block dimension的时候的注意事项
- 使用usb tplink无线网卡搭建无线热点AP
- 使用squid搭建https透明代理
- 使用sslsplit实现https,imaps,pop3s, smtps等透明代理
- java switch 选择结构语句,输入非数字的解决方案!
- Java 十大异常报错(Exception)
- 第五章 循环和关系表达式(1)
- kubernetes1.4 基础篇:Learn Kubernetes 1.4 by 6 steps(2):Step 1. Create a Kubernetes cluster
- Maven从零开始_1_Maven概览