CUDA 矩阵编写 小试牛刀
来源:互联网 发布:人工智能的未来下载 编辑:程序博客网 时间:2024/06/01 10:22
简单矩阵CUDA运算
在cuda里面运算,都需要再GPU里面分配空间,OpenCV中可以用GpuMat
__global__ void Add(int *A,int *B,int *C){int i=threadIdx.x; //x可以理解成index,//二维数组的话,y*width+x 可以理解成线性存储的index C[i]=A[i]+B[i];}int main(){int N=10;int A[10]={1,2,3,4,5,6,7,8,9,10};int B[10]={3,3,3,3,3,3,3,3,3,3};int *cuA,*cuB,*cuC;int C[N];cudaMalloc((void**)&cuC,sizeof(int)*N);//分配空间cudaMalloc((void**)&cuA,sizeof(int)*N);cudaMalloc((void**)&cuB,sizeof(int)*N);cudaMemcpy(cuA,A,sizeof(int)*N,cudaMemcpyHostToDevice);cudaMemcpy(cuB,B,sizeof(int)*N,cudaMemcpyHostToDevice);Add<<<1,N>>>(cuA,cuB,cuC);cudaMemcpy(&C,cuC,sizeof(int)*N,cudaMemcpyDeviceToHost);cudaFree(cuA);//释放空间cudaFree(cuB);cudaFree(cuC);//2D//A[][],B[][],C[][]//const dim3 blockDim(8,8);//2的幂//const dim3 gridDim((width+blockDim.x-1)/blockDim.x,(height+blockDim.y-1)/blockDim.y);//Add<<<gridDim,blockDim>>>(A,B,C);}
一个简易的矩阵运算 就算是完成了,够简单的.....
阅读全文
0 0
- CUDA 矩阵编写 小试牛刀
- CUDA 矩阵转置
- 矩阵赋值CUDA实现
- CUDA的矩阵算法
- CUDA矩阵乘法
- CUDA 矩阵乘法优化
- CUDA:矩阵乘法原理
- CUDA矩阵BLAS效率
- CUDA: 矩阵乘法优化
- cuda 矩阵乘法
- cuda编程------矩阵乘法
- CUDA程序代码--矩阵计算
- CUDA矩阵相乘
- CUDA: 矩阵乘法优化
- CUDA二维矩阵加法
- CUDA矩阵元素求和
- CUDA 二维矩阵操作
- cuda中的矩阵乘法
- 闭包中变量值的改变
- 要点提炼|开发艺术之View
- java之面向对象3
- uip协议栈移植的原理图、pcb、原理图库、pcb库
- 剑指offer——面试题61:按之字形顺序打印二叉树
- CUDA 矩阵编写 小试牛刀
- 点分治学习笔记(2) tree
- LintCode_539_移动零
- 关于SQL宽字节注入的学习
- 利用优先队列PriorityQueue实现Prim算法
- 2017 年成为 Linux 专家的 4 个热门技能
- socketserver模块
- 程序编译过程
- Linux多线程编程之设置线程属性,设置线程分离属性