PTX ISA 之 原子操作 atom 的小结
来源:互联网 发布:大数据工程师工作强度 编辑:程序博客网 时间:2024/06/07 03:26
关于 原子操作 atom 的小结
atom
Atomic reduction operations for thread-to-thread communication.
语法
atom{.space}{.scope}.op.type d, [a], b; atom{.space}{.scope}.op.type d, [a], b, c; .space = { .global, .shared }; .scope = { .cta, .gpu, .sys }; .op = { .and, .or, .xor, // .b32, .b64 .cas, .exch, // .b32, .b64 .add, // .u32, .s32, .f32, .u64, .f64 .inc, .dec, // .u32 only .min, .max }; // .u32, .s32, .u64, .s64 .type = { .b32, .b64, .u32, .u64, .s32, .s64, .f32, .f64 };
描述
实际上,一次atom操作,即 read—motified—write 三步操作
eg
atom.global.inc.s32 d,[a],n;
1.从 a 的地址里读到 d 中,
read/load
2.根据inc的定义
计算 ((d >= n) ? 0 : (d+1));
motified
3.然后把 算出的值 再写回 a 的地址里。
write/store
inc其含义,就是当 a 增长到 n 时,置a = 0;
ptx isa - atom
http://docs.nvidia.com/cuda/parallel-thread-execution/#parallel-synchronization-and-communication-instructions-atom
atomicInc()详细分析
http://stackoverflow.com/questions/18008975/atomicinc-is-not-working
* nvidia 官方文档 link*
https://docs.nvidia.com/cuda/cuda-c-programming-guide/#arithmetic-functions
0 0
- PTX ISA 之 原子操作 atom 的小结
- PTX ISA 之 comparisions 小结
- PTX ISA 之 volatile 的用法
- PTX ISA 之 cache operator
- PTX ISA 之 同步指令 bar & membar
- PTX ISA 之 BFS 代码分析
- PTX ISA 之 Control Flow Instructions
- PTX ISA 之 Control Flow Instructions
- PTX ISA Special Registers
- CUDA PTX ISA阅读笔记(一)
- CUDA PTX ISA阅读笔记(二)
- 原子(atom)本意是“不能被进一步分割的最小粒子”,而原子操作(atomic operation)
- 多线程之原子操作
- 多线程 之原子操作
- 驱动程序之原子操作
- ATOM全局原子
- Erlang原子(atom)的内部实现及应用
- WINCE的原子操作
- Error configuring application listener of class org.springframework.web.context.ContextLoaderListene
- [leetcode] 530. Minimum Absolute Difference in BST
- 8、打包和压缩
- 禁止在浏览器中选择和复制黏贴
- Matlab读取图像,并将该图像转换为灰度图像
- PTX ISA 之 原子操作 atom 的小结
- Windows 系统 Github push 或者 下载慢
- 一直以来都没直视的轮播-_-
- 牛客网—剑指offer-用两个栈实现队列
- Android.mk 文件,多个mk文件
- boost::exception
- 树之非递归二叉树先序 中序 后序遍历合集
- Caused by: java.lang.NoClassDefFoundError: org/springframework/aop/TargetSource
- 【ORACLE】报错IMP-00003ORA-02304IMP-00017