《GPU高性能编程CUDA实战》—— 《笔记一》——使用线程实现GPU上的矢量求和

来源：互联网发布：女儿出嫁父亲感人知乎编辑：程序博客网时间：2024/04/28 07:50

使用线程实现GPU上的矢量求和

//**************使用线程实现GPU上的矢量求和**********///* 时间：2017-8-9参考书：《GPU高性能编程CUDA实战》*/#include <iostream>#include <stdio.h>#define N 10using namespace std;__global__ void add(int *a,int *b,int *c);int main(){int a[N],b[N],c[N];int *dev_a,*dev_b,*dev_c;//在GPU上分配内存cudaMalloc((void**)&dev_a,N*sizeof(int));cudaMalloc((void**)&dev_b,N*sizeof(int));cudaMalloc((void**)&dev_c,N*sizeof(int));//在CPU上为数组"a""b"赋值for(int i=0;i<N;i++){a[i]=i;b[i]=i*i;}//将数组“a”"b"复制到GPUcudaMemcpy(dev_a,a,N*sizeof(int),cudaMemcpyHostToDevice);cudaMemcpy(dev_b,b,N*sizeof(int),cudaMemcpyHostToDevice);add<<< 1,N>>>(dev_a,dev_b,dev_c);//将数组“c”从GPU赋值到CPUcudaMemcpy(c,dev_c,N*sizeof(int),cudaMemcpyDeviceToHost);//显示结果for(int i=0;i<N;i++){printf("%d + %d = %d\n",a[i],b[i],c[i]);}//释放在GPU上分配的内存cudaFree(dev_a);cudaFree(dev_b);cudaFree(dev_c);return 0;}__global__ void add(int *a,int *b,int *c){int tid=threadIdx.x;if(tid<N){c[tid]=a[tid]+b[tid];}}

阅读全文

0 0