CUDA内存三
来源:互联网 发布:侠客风云传 招式数据 编辑:程序博客网 时间:2024/05/29 06:55
内存类型
(__device__)__shared__修饰的变量,表示CUDA中的共享变量。共享变量的scope是block,block中的所有线程都可以看到共享变量的同一个版本。Lifetime是kernel,kernel结束,共享变量内存也就不存在了。对共享内存的访问非常快而且是高度并行的。CUDA编程者通常用共享内存来保留一部分在kernel中用的多的全局内存数据。
float * ptr=&GlobalVar。
减少全局内存通信的策略
__global__ void MatrixMulKernel(float* Md, float* Nd, float* Pd, int Width)
{
1. __shared__float Mds[TILE_WIDTH][TILE_WIDTH];
2. __shared__float Nds[TILE_WIDTH][TILE_WIDTH];
3. int bx = blockIdx.x; int by = blockIdx.y;
4. int tx = threadIdx.x; int ty = threadIdx.y;
// Identify the row and column of the Pd element to work on
5. int Row = by * TILE_WIDTH + ty;
6. int Col = bx * TILE_WIDTH + tx;
7. float Pvalue = 0;
// Loop over the Md and Nd tiles required to compute the Pd element
8. for (int m = 0; m < Width/TILE_WIDTH; ++m) {
// Coolaborative loading of Md and Nd tiles into shared memory
9.
10.
11.
12.
13.
14. }
15. Pd[Row][Col] = Pvalue;
}
硬件限制:
注意:不时关注CUDA主页,关注CUDA相关的最新研究
http://www.nvidia.com/object/cuda_home.html#
- CUDA内存三
- cuda《学习笔记三》——共享内存和同步
- CUDA入门学习(三):共享内存与线程同步
- cuda device 内存丢失
- CUDA使用纹理内存
- CUDA内存类型memory
- CUDA线性内存分配
- CUDA 纹理内存
- CUDA内存拷贝
- cuda纹理内存
- cuda数组内存分配
- CUDA内存拷贝
- CUDA内存访问
- CUDA内存使用
- CUDA内存分配
- CUDA常量内存
- CUDA内存简介
- CUDA内存类型memory
- python读取excel文件(xrld模块)
- 暗示的健康就是加大甲方叫撒大姐夫
- python小知识
- Decode Ways [leetcode] DP
- COM组件与javascript 交互问题
- CUDA内存三
- Linux之Ubuntu学习003——gcc/g++编译器
- 原来iTunes Connect 的 reject binary 改变为 remove this version from review
- 代理缓存服务器知识点整理
- POJ 1016 - Numbers That Count
- UVA 11019 字符矩阵哈希
- 黑马程序员_Java基础05天日志
- STL set和multiset
- hdu4577(大数+分析)