CUDA性能优化----kernel调优(nvprof工具的使用)

来源:互联网 发布:水仙花数java代码 编辑:程序博客网 时间:2024/06/16 05:10


http://blog.163.com/wujiaxing009@126/blog/static/71988399201701310151777?ignoreua

主要用nvprof评价性能,主要三点。
occupancy

nvprof --metrics achieved_occupancy ./a.out

gld_throughput

nvprof --metrics gld_throughput

gdl_efficiency

nvprof --metrics gld_efficiency
1 0
原创粉丝点击