初学习opencl

来源:互联网 发布:淘宝卖家 收藏店铺 编辑:程序博客网 时间:2024/06/03 20:04

这里介绍关于OpenCL中program函数的写法,program函数通常是文本形式的,然后使用clCreateProgramWithSource这样的接口load进来。在Shader编程中也经常使用这种形式书写GPU上运行的代码,所以为了表述清楚和理解方便,这里姑且把这些program函数的源码文本称为OpenCL的shader吧

 下面都是写在shader中的一些语法

 

1 shader是类C的语言,派生自C99标准(99年ansi C接受的标准,也是C最新的标准)

不支持:

   头文件、函数指针、递归、变长数组(这个VS也不支持)

额外加入的类型:

   vector 类型 char2 ushaort4 int8  这些最后都会变成长度对齐的

   图像类型 image2d_t image3d_t  sampler_t ...

   event类型 event_t(关联于API中CL_event)

 

 

2.work item和 work Group相关函数

 

 

 3.vector 操作

vector的前一半为lo,后一半为hi

int4 v=(int4) 7 =(int4)(7,7,7,7)

 v=(in4)(1,2,3,4)

int2 v2=v.lo ->(1,2)

v2=v.hi ->(3,4)

v2.v.odd ->(2,4)

对vector做四则运算、abs等于对每个元素分别计算

 

 4.寻址空间描述符,写在变量的最前面,用于变量所处于的地址空间

__global

__local

__private

__constant

这四个分别对应了CL架构中的存储区域(设备全局、work group、compute unit 、设备constant)

 

  • 前面的__也可去掉
  • 目前global一定是constant的,也就是声明global时必须赋值 (global就等于 global constant)
  • 不同地址空间上的指针转化是没有定义的

 5.类型转换

  5.1convert类型转换;这是按照变量语意的类型转换

写成convert_destType<_sat><_roundingMode>形式,

如float4 f4=(float4)(1.0f,2.0f,3.0f,4.0f)

int4 i4=convert_int4_sat_rte(f4)

 

destType:目标类型

_sat:超出范围自动归结为最大或最小显示的数

_roundingMode:

   _rte:表示成最接近的偶数

   _rtz:朝0接近

   _rtp:朝正无穷大

  _rtn:朝负无穷大

这里面的规则比较复杂,详见http://www.khronos.org/registry/cl/sdk/1.2/docs/man/xhtml/convert_T.html 

 

5.2 as转换:这是根据bit值重新解释的类型转换

写成as_desttype

其中转换前后的类型的vetctor size是要一样的,desttype是目标类型,这个转换会保持bit值不变,在此基础上根据desttype重新解释数值

as转换和convert转换有着本质的区别!

如float4 f4=(float4)(1.0f,2.0f,3.0f,4.0f)

int4 i4=as_int4(f4)

 

6.内建函数:

6.1各种各样超多的数学函数
:详见http://www.khronos.org/registry/cl/sdk/1.2/docs/man/xhtml/的Built_in Function一节

贴个简表

6.2Work_group函数:

主要用于一个group内的computer item间的交互

  •   同步函数void barrier (cl_mem_fence_flags flags)

            一个goup内的所有item必须全部执行完这个barrier函数之后才能继续进行后续的事情,也可看做这是所有item的一个同步点,不管谁快谁慢,必须到这个点停一下,大家都到了这个点之后,再继续进行。

        这里的参数分两种情况:

          CLK_LOCAL_MEM_FENCE和CLK_GLOBAL_MEM_FENCE

      这个参数我现在也没搞得很懂,大意是加入一个mem fence保证这时loca mem或者globalmem 的同步正常,关于mem fence 的概念还要再看看opencl的描述

       

  • 异步的内存copy和prefetch函数

         async_work_group_copy:他会完成global与local之间的异步的内存拷贝,这种拷贝可能会使用DMA 引擎的(DMA的数据传输不使用传统的硬件中断,会很快),这个函数是异步的,所以会返回一个事件event_t用于同步

        使用wait_group_events函数来等待上面的event返回,用于同步

        async_work_group_strided_copy:文档上说它用于gather数据从src到dest,但是文档中gather的意思不能让人很好的理解,仔细的分析一下,这个函数同  async_work_group_copy的差异在于stride,他也是完成异步的拷贝,但是它可以从src抽取一部分域出来到dst中。例如在图形学中我们经常用一个大数组表示颜色、法向、纹理坐标等等,他们是连在一起的,如{color1,ccolor2,color3,tex0,tex1,color1,color2,color3,text0,tex1,....},这时我们需要抽取其中的color信息出来,那就要用到这个stride copy。

  

    

 

        

          

 

 

 

 

0 0
原创粉丝点击
热门问题 老师的惩罚 人脸识别 我在镇武司摸鱼那些年 重生之率土为王 我在大康的咸鱼生活 盘龙之生命进化 天生仙种 凡人之先天五行 春回大明朝 姑娘不必设防,我是瞎子 qq群成员满了怎么办 qq知道密码没手机号验证怎么办 改房本上的名字怎么办 支付宝租给别人怎么办 微信麻将房间卡怎么办 皮肤挤伤了发黑怎么办 指甲被挤了黑了怎么办 手指被挤了变黑怎么办 榆次买房太原户口怎么办 皮肤又红又黑怎么办 打仙桃晃晃老输怎么办 微信支付忘了摇怎么办 苹果手机微信摇一摇摇不了怎么办 打麻将牌背的时候怎么办 打麻将背的时候怎么办 同城游台球初使化失败怎么办 qq密码改忘了怎么办啊 qq头像显示不出来怎么办 qq的重要数据被清理怎么办 把qq数据删除了怎么办 手机qq头像显示不同怎么办 手机qq图片显示不出来怎么办 微信群聊右上角双人头像没了怎么办 支付宝好友没了怎么办 手机qq好友头像没了怎么办 微信语音变成听筒模式怎么办 微信语音为听筒模式怎么办 微信设置成听筒模式怎么办 微信验证看不全怎么办 qq看视频无法放大怎么办 苹果6功能键坏了怎么办 qq显示不了头像和图片怎么办 关于学校随便更换老师家长怎么办 qq群昵称改不了怎么办 电脑qq群视频进不去怎么办 微信头像没保存怎么办 qq群信息不响怎么办 微信封面换不了怎么办 微信头像没有了怎么办 科二超过5次怎么办 蘑菇街个人中心打不开怎么办