PS3 SPU编程tip ---读Charles Bloom blog 之笔记
来源:互联网 发布:经期记录软件 编辑:程序博客网 时间:2024/05/22 12:27
Charles Bloom的博客在这里 http://cbloomrants.blogspot.com/
1. 似乎用si_func 和dword变量比 spu_func和vector变量好一点。因为spu_function是c++函数,性能回比直接用汇编慢。si_function相对好一点。
2. Rotate left 要花费两指令, Rotate right要花费3指令。
3.只分支预测最可能出现的那个分支就好了,也就是__builtin_expect最好都是true。或者把最可能出现的分支放在离if比较近的地方
4.最好是单数cycle数的指令和偶数cycle数的指令间隔使用。实在不行用-mdual-nops=1塞一个空指令
5.对于LSU要小心了,一般编译器会弄好。但是有时候自己也要关心下。指令少不一定就快。 一个LSU可能就是4个clock,相当于8条指令呢
6.对于ppu, 计算地址再跳转比较慢,所以循环的时候不要用 array[index], 而用array++
7. ++i比i++好
- PS3 SPU编程tip ---读Charles Bloom blog 之笔记
- 测试工具之charles学习笔记1
- Charles笔记
- 仓库基础知识之什么是SPU、SKU、ARPU
- charles 学习笔记之代理http,https请求
- Bloom Filter 系列改进之Bloom Tree
- 编程小Tip
- 编程题Tip
- OpenGL核心技术之Bloom
- Charles抓包笔记
- Linux笔记--使用tip
- charles之map local
- charles之map功能
- charles之初安装
- charles之断点mock
- charles之配置
- 小Tip之int...
- openssh tip (沉睡不醒blog)
- C# 百分比问题
- touch讲解(Linux)
- 一款很不错的html转xml工具-Html Agility Pack
- JAVA实现HTTP服务器端
- Studying note of GCC-3.4.6 source (78)
- PS3 SPU编程tip ---读Charles Bloom blog 之笔记
- 卡罗拉大保养
- “不要自己发明轮子”与“了解轮子是如何发明的”
- 利用htmlparser把html转成xlm
- 使用HtmlAgilityPack批量抓取网页数据
- 南海问题
- SpringSide 3.3.3 大众搬屋版
- 怎么学好SQL serve
- [转载]Nginx完整配置说明