OpenCL 初实践(1)矩阵相乘
来源:互联网 发布:我是歌手4网络踢馆赛 编辑:程序博客网 时间:2024/05/19 15:24
对2000*2000的两个矩阵做矩阵相乘,
执行内核 设定的globalsize 是二维的,200*200,实验环境是centos OpenCL 2.0 AMD-APP (1800.5) AMD Accelerated Parallel Processing,
MaxItemSize=256,256,256,
故选取的globalsize global item size 是200,200.
size_t globalSize[2] = {200,200};
size_t localSize[1] = {200};
err = clEnqueueNDRangeKernel(commands, kernel, 2, NULL, globalSize, NULL, 0, NULL, NULL);
核函数:
__kernel void mmult(__global int* a, __global int* b, __global int* output)
{int width = get_global_id(1);
int height = get_global_id(0);
int num_size = get_global_size(0);
int rank = 2000;
for (int total = 1;total<=10;total++)
{
int running = 0;
for(int num =0;num<2000;num++)
{
int aIndex = width*rank+num;
int bIndex = num*rank + height*10+total-1;
running += a[aIndex]*b[bIndex];
}
output[width*rank+height*10+total-1] = running;
}
return;
}
0 0
- OpenCL 初实践(1)矩阵相乘
- openCL-矩阵相乘
- OpenCL例程3-矩阵相乘
- C++实战之OpenCL矩阵相乘优化(二)
- C++实战之OpenCL矩阵相乘
- 矩阵相乘(uva348)
- 数据结构--稀疏矩阵(相乘)
- 矩阵相乘(三元组)
- 矩阵相乘(分治法)
- 矩阵相乘(C案例)
- 蓝桥杯-矩阵相乘(java)
- 数组与矩阵(1)_矩阵相乘
- 矩阵相乘法(稀疏矩阵)
- 矩阵乘法(两个矩阵相乘)
- 矩阵相乘
- 矩阵相乘
- 矩阵相乘
- 矩阵相乘
- hihocoder 1068 RMQ-ST入门
- MFC(一)——Windows程序内部运行原理
- 关于模版类编译出现unresolved external symbol的问题
- 程序员提高效率的一些建议
- memcpy和memmove的实现
- OpenCL 初实践(1)矩阵相乘
- MySQL大小写敏感说明
- Gallery API 16 被替换掉了
- 有关listview 适配器的小问题
- linux vi常用命令详解
- 【SpingIOC】管理事物的实现详解
- JavaScript强化教程——jQuery选择器
- 是时候吹一波Android N的新特性了。
- 【Unity3d】【项目学习心得】从资源服务器下载资源(三)