Cuda笔记1 --- 内积
来源:互联网 发布:洛氏霍克指标源码 编辑:程序博客网 时间:2024/05/01 08:25
/* CUDA 内积简单例程 */const int THREAD_DIM = 256;void __global__ dot(const float* d_a, const float* d_b, float* d_c , const int n) {int tid = threadIdx.x + blockIdx.x * blockDim.x;int threads = threadIdx.x; __shared__ float cache[THREAD_DIM];float temp = 0.0;while(tid < n){temp += d_a[tid] * d_b[tid];tid += blockDim.x * GridDim.x;}// 将每一个线程计算的乘积放入相应block中的shared memory里cache[threads] = temp;__syncthreads();//归约求每一个block中内积和 int i = blockDim.x / 2;while( i != 0){if ( threads < i ){cache[threads] += cache[threads + i]}__syncthreads();i>>2;}if (threads == 0) // 选择一个线程取出一个block中的和{d_c[blockIdx.x] = cache[0];}}int main(){int n = some const;dim3 blockPergrid((n +255) / 256, 1);dim3 threadPerblock(256,1);// 将每个block中得和取出在CPU中求和}
0 0
- Cuda笔记1 --- 内积
- cuda——向量内积
- CUDA计算向量内积的程序(源自CUDA范例编程)
- CUDA学习笔记(1)
- CUDA学习笔记(1)
- CUDA 学习笔记 1
- CUDA学习笔记(1)
- CUDA归约处理——向量的内积
- CUDA笔记1:环境配置
- CUDA笔记
- cuda 笔记
- CUDA笔记
- CUDA笔记
- cuda笔记
- CUDA学习笔记(一) CUDA编程模型1
- 编程题-最小向量内积-(1)
- 线性代数笔记(内积空间,实二次型)
- CAFFE源码学习笔记之内积层-inner_product_layer
- Hibernate 4.3关于org.hibernate.service.jndi.JndiException: Error parsing JNDI name [foo]等异常
- C#人事管理系统开发(4)公共类设计
- java 中String与StringBuilder 效率
- hibernate4.3中SessionFactory的创建
- loadrunner性能测试——第一步 录制脚本
- Cuda笔记1 --- 内积
- 一缕夏风涌动,掠过翠绿色的日子
- OOM的解决之道
- 【鸟哥 linux 基础篇】 第6章 Linux的档案权限与目录配置
- 解析无限级树结构,加载dhtmlxTree数据
- 实用的堆
- 位置预测系列(二)
- 第十六周(OJ 练习一 7)——抽象基类。
- 2014年360广告算法面试经历