cuda核函数再调用核函数,多层并行

来源:互联网 发布:甄嬛传 三观不正 知乎 编辑:程序博客网 时间:2024/06/06 00:15
#include <stdio.h>__global__ void childKernel(int i){int tid = blockIdx.x*blockDim.x+threadIdx.x;printf("parent:%d,child:%d\n",i,tid);for(int j=i;j<i+10;j++){printf(",%d",j);}printf("\n");}__global__ void kernel(){int tid = blockIdx.x*blockDim.x+threadIdx.x;childKernel<<<1,2>>>(tid);}int main(){kernel<<<1,1>>>();cudaDeviceSynchronize();return 0;}

0 0
原创粉丝点击