《GPU高性能编程CUDA实战》—— 《笔记一》——使用线程实现GPU上的矢量求和
来源:互联网 发布:女儿出嫁父亲感人知乎 编辑:程序博客网 时间:2024/04/28 07:50
使用线程实现GPU上的矢量求和
//**************使用线程实现GPU上的矢量求和**********///* 时间:2017-8-9参考书:《GPU高性能编程CUDA实战》*/#include <iostream>#include <stdio.h>#define N 10using namespace std;__global__ void add(int *a,int *b,int *c);int main(){int a[N],b[N],c[N];int *dev_a,*dev_b,*dev_c;//在GPU上分配内存cudaMalloc((void**)&dev_a,N*sizeof(int));cudaMalloc((void**)&dev_b,N*sizeof(int));cudaMalloc((void**)&dev_c,N*sizeof(int));//在CPU上为数组"a""b"赋值for(int i=0;i<N;i++){a[i]=i;b[i]=i*i;}//将数组“a”"b"复制到GPUcudaMemcpy(dev_a,a,N*sizeof(int),cudaMemcpyHostToDevice);cudaMemcpy(dev_b,b,N*sizeof(int),cudaMemcpyHostToDevice);add<<< 1,N>>>(dev_a,dev_b,dev_c);//将数组“c”从GPU赋值到CPUcudaMemcpy(c,dev_c,N*sizeof(int),cudaMemcpyDeviceToHost);//显示结果for(int i=0;i<N;i++){printf("%d + %d = %d\n",a[i],b[i],c[i]);}//释放在GPU上分配的内存cudaFree(dev_a);cudaFree(dev_b);cudaFree(dev_c);return 0;}__global__ void add(int *a,int *b,int *c){int tid=threadIdx.x;if(tid<N){c[tid]=a[tid]+b[tid];}}
阅读全文
0 0
- 《GPU高性能编程CUDA实战》—— 《笔记一》——使用线程实现GPU上的矢量求和
- 《GPU高性能编程CUDA实战》—— 《笔记三》——点积运算
- 《GPU高性能编程CUDA实战》学习笔记(一)
- 基于共享内存的位图——GPU高性能编程CUDA实战5.3.3
- GPU高性能编程CUDA实战——Julia曲线生成错误
- 《GPU高性能编程CUDA实战》学习笔记(二)
- 《GPU高性能编程CUDA实战》学习笔记(三)
- 《GPU高性能编程CUDA实战》学习笔记(四)
- 《GPU高性能编程CUDA实战》学习笔记(五)
- 《GPU高性能编程CUDA实战》学习笔记(六)
- 《GPU高性能编程CUDA实战》学习笔记(七)
- 《GPU高性能编程CUDA实战》学习笔记(八)
- 《GPU高性能编程CUDA实战》学习笔记(九)
- 《GPU高性能编程CUDA实战》学习笔记(十)
- 《GPU高性能编程CUDA实战》学习笔记(十一)
- 《GPU高性能编程CUDA实战》学习笔记(十二)
- 《GPU高性能编程CUDA实战》 《学习笔记二》
- 《GPU高性能编程cuda实战》读书笔记
- 经典论文阅读——DeepFashion: Powering Robust Clothes Recognition and Retrieval with Rich Annotations (CVPR 2
- Java 内存分配详解
- HDU 3007:Buried memory
- NYOJ 119 士兵杀敌(三)
- Vue.js 实现表单数据参数传递,以及不同独立按钮之间的参数传递
- 《GPU高性能编程CUDA实战》—— 《笔记一》——使用线程实现GPU上的矢量求和
- Web会话安全分析工具ProxyStrike
- Redis cluster on Windows
- 深入理解java垃圾回收机制
- 百炼-2972-确定进制-C语言-数制转换
- YOLO_tensorflow-master运行与参考记录 模型保存与运行
- 图片裁剪--css
- android线程通信基础分析
- 课程四:个性化推荐-基于用户画像的物品推荐 22分钟