使用六 (进一步熟悉Call Graph)
来源:互联网 发布:深度卸载软件下载 编辑:程序博客网 时间:2024/05/16 10:13
简述:
上一个使用测试中,对Vtune的Call Graph工具有了初步认识,这里就进行实用性的测试
参数(百度百科):
MFLOPS:
Million Floating-point Operations per Second, 每秒百万个浮点操作) 衡量计算机的主要技术指标。
对于一个给定的程序, MFLOPS = 操作浮点数 / (执行时间 * 10 ^ 6)
该指标用于比较同一系统上求解同一问题不同算法的性能
步骤:
1. 现在Command 中运行一个基准程序
之后得到一组结果,
做完上面这个实验之后,需要还原linpack_c这个文件夹至实验前的模式,
2. 在Vtune中创建一个Activity, 选择Sampling Wizard,
将duration 调整为120
完成。进入Linpack_c的module显示界面,
1) 可以看到,除了matgen和 get_frequency之外clocktick samples 最多的就是daxpy函数
3. 替换原先的C版本的程序,这里使用Intel的MKL 版本
首先仍然是在命令行中,泡一下linpack_c_mkl_daxpy.exe
之后得到的输出结果,
4. 使用Vtune的Call Graph Wizard继续做测试
Call Graph 选中, 程序为linpack_c.exe,运行之后的结果:
可以看到是second这函数运行的时间最长,点入这个函数
5. 之后测试一下linpack_mkl.exe这个程序
首先在命令行下跑linpack_mkl,.exe
运行之后的结果如下,
三个程序
linpack_c.exe
linpack_c_mkl_daxpy.exe
linpack_mkl.exe
运行之后看到吗, Mflops 最大的认识linpack_mkl.exe的结果5809.04, 性能最好
- 使用六 (进一步熟悉Call Graph)
- 使用五 (Call Graph试用)
- 算法(六)Clone Graph
- CUDA编程(六)进一步并行
- CUDA编程(六)进一步并行
- Tesseract Call Graph
- 进一步熟悉gridview控件的功能
- Js_百度地图api进一步熟悉
- llvm:Call Graph And Control Flow Graph
- VTune Call Graph Utilization Report
- RobotFramework示例的Call Graph
- merge-sort-call-tree-graph
- Fragment的进一步使用(一)
- Fragment的进一步使用(二)
- (guava)的API快速熟悉使用
- graph使用
- 数组的进一步使用
- Egypt生成Linux kernel call graph
- c++五种内存分配、堆与栈区别
- 一堂如何提高代码质量的培训课
- redhat5安装yum源
- 使用php和mysql,数据库显示插入成功,但是数据表内数据为空
- Uboot命令
- 使用六 (进一步熟悉Call Graph)
- ImageView组件的几个需要注意的属性
- SUSE配置samba
- Hibernate_一对一单向外键关联_Annotation
- C语言和Unix的发明史
- SQL命令行可以使用help index查询出有哪些命令
- 什么是可选参数列表 [java]
- 分析函数
- ELF重定位类型分析(1-3, 总结)加评版