GPU的硬件结构
来源:互联网 发布:淘宝仓库宝贝多久删除 编辑:程序博客网 时间:2024/04/30 21:59
GPU的硬件结构,也不是具体的硬件结构,就是与CUDA相关的几个概念:thread,block,grid,warp,sp,sm。
sp: 最基本的处理单元,streaming processor 最后具体的指令和任务都是在sp上处理的。GPU进行并行计算,也就是很多个sp同时做处理
sm:多个sp加上其他的一些资源组成一个sm, streaming multiprocessor. 其他资源也就是存储资源,共享内存,寄储器等。
warp:GPU执行程序时的调度单位,目前cuda的warp的大小为32,同在一个warp的线程,以不同数据资源执行相同的指令。
grid、block、thread:在利用cuda进行编程时,一个grid分为多个block,而一个block分为多个thread.其中任务划分到是否影响最后的执行效果。划分的依据是任务特性和
GPU本身的硬件特性。
下面几张硬件结构简图 便于理解(图片来源于网上)
以上两图可以清晰地表示出sm与sp的关系。
此图反应了warp作为调度单位的作用,每次GPU调度一个warp里的32个线程执行同一条指令,其中各个线程对应的数据资源不同。
上图是一个warp排程的例子。
一个sm只会执行一个block里的warp,当该block里warp执行完才会执行其他block里的warp。
进行划分时,最好保证每个block里的warp比较合理,那样可以一个sm可以交替执行里面的warp,从而提高效率,此外,在分配block时,要根据GPU的sm个数,分配出合理的
block数,让GPU的sm都利用起来,提利用率。分配时,也要考虑到同一个线程block的资源问题,不要出现对应的资源不够。
原文出处:http://www.cnblogs.com/dwdxdy/p/3215158.html
- GPU的硬件结构
- GPU硬件结构--CUDA
- [转]GPU硬件结构
- CUDA: GPU的硬件架构
- 深度学习的GPU硬件选型
- 路由器的硬件结构
- TMS320C55x的硬件结构
- 单片机的硬件结构
- GPU硬件虚拟化
- IOS 硬件GPU解码
- 中断系统的硬件结构
- 51单片机的硬件结构
- CUDA硬件实现分析(一)------安营扎寨-----GPU的革命
- CUDA硬件实现分析(二)------规行矩步------GPU的革命
- 深入浅出谈CUDA-[第六章][GPU的硬件架构]
- 研究深度学习的硬件配置(折腾GPU)
- 从深度学习选择什么样的gpu来谈谈gpu的硬件架构
- 【GPU编程系列之一】从深度学习选择什么样的gpu来谈谈gpu的硬件架构
- nginx入门学习—— 在已安装好的nginx上添加nginx_upstream_check_module模块(三)
- centos 优先使用本地源
- Zepto源码分析之二~三个API
- AttributeError: 'module' object has no attribute 'randint'
- 怀疑点
- GPU的硬件结构
- typeid
- Github使用学习笔记
- 每隔5秒发一条新浪和腾讯微博的windows软件
- 顺序队列的入队,出队,遍历队列计算队列的长度
- apache本地配置多域名(wampserver本地配置多域名)
- uva 1378 - A Funny Stone Game sg博弈
- 【HDU】2014上海全国邀请赛——题目重现(感谢上海大学提供题目) 题解
- 理解webservice