关于Float峰值计算的方法
来源:互联网 发布:托福tpo模考软件mac版 编辑:程序博客网 时间:2024/06/14 11:25
关于Float峰值计算的方法
版权声明:本文为博主原创文章,未经博主允许不得转载。
linpack百度百科: http://baike.baidu.com/view/485828.htm
集群理论浮点峰值=CPU主频(GHz)×4(CPU每时钟周期执行浮点运算次数)×节点数×8(每节点双路四核)
例如单节点机CPU为Xeon E5430,则其理论峰值=1.66×4×1×8=53.12 GFLOPS
另外一个经常被用来评价计算机性能的简单指标是峰值速度。计算机的峰值速度通常是指其理论峰值速度,其计算公式是:
理论峰值速度(亿次)= MHz x 每个时钟周期执行浮点运算的次数 x CPU数目/108
其中MHz是指CPU的主频,每个时钟周期执行浮点运算的次数是由处理器中浮点运算单元的个数及每个浮点运算单元在每个时钟周期能处理几条浮点运算来决定的。以IBM POWER4为例,每个POWER4的处理器有两个浮点运算单元,每个浮点运算单元在一个时钟周期内可以同时处理一个加法和一个乘法的操作。所以如果处理器的主频为1.7GHz(POWER4+),那么该处理器的峰值速度为1.7G*2*2=6.8Gflop/s,或68亿次/秒。对于满配置的IBM p690来说,该系统的峰值速度就是1.7G*2*2*32=217.6Gflops,或2176亿次/秒。不同的处理器每个时钟周期能执行浮点运算的次数不同。在市场中常见处理器的情况如下:
每个时钟周期能执行浮点运算的次数:
IBM Power4 4
HPQ PA-RISC 4
HPQ Alpha 2
SUN Ultra-Sparc 2
SGI MIPS 2
Intel Itanium 4
Intel Pentium 1
Intel Xeon 2
峰值速度在一定程度上能够反映处理器的性能,但并不能代表计算机的实际运算能力。为此许多组织试图用一些标准的程序来测试计算机的运算速度,其中LINPACK以其使用简单、适用性强等特点被广泛地用于评价计算机的实际峰值运算能力。虽然这些指标并不反映给定系统的全部系统性能,但可以作为对系统理论峰值性能的一个修正。
世界计算机TOP500排名就是以LINPACK的测试结果为基础的。
对于intel xeon e7-8837的理论flops计算是不是:
2.66(主频)×8(核心)×4(每周期浮点运算次数)=85.12 gflops
对于amd opteron 6220的峰值flops:
3(主频)×8(核心)×4(每周期浮点运算次数)=96 gflops
现在困惑在于CPU每周期浮点运算次数的参数查不到,我也是听说x86架构目前能达到4个浮点运算/时钟周期,而intel和amd都有某些型号产品能做到8个浮点运算/时钟周期,请教哪里能查到这个数据?或知道的请回帖告知以上两款CPU的每周期浮点运算次数,谢谢。
zouming1979 (站内联系TA)
目前大多数的理论峰值是按照x4的来计算,因为通常cpu核可以一拍执行两条指令,每条指令可以执行两个操作,因此是x4。
intel新架构的处理器增加了新的指令集AVX,因此一条指令可以执行四个操作,故新架构的处理器x8,也就说支持新指令集AVX的intel处理器都是x8。
新架构sandy bridge和ivy bridge都是x8。 服务器处理器E5-XXXX, E3-XXXX都是x8。
PC机上用的处理器不清楚,不太关注。
AMD性能太差,现在也不太关注。
风间的记忆 (站内联系TA)
如LS所言
FLOPS只是理论数值
实际AMD虽高 但实际性能并不好
牵扯CPU架构等很多方面
建议购买INTEL
psfan (站内联系TA)
2楼: Originally posted by zouming1979 at 2012-05-03 1840:
目前大多数的理论峰值是按照x4的来计算,因为通常cpu核可以一拍执行两条指令,每条指令可以执行两个操作,因此是x4。
intel新架构的处理器增加了新的指令集AVX,因此一条指令可以执行四个操作,故新架构的处理器 ...
请问e7-8837是x4还是x8?
zouming1979 (站内联系TA)
e7-8837 我看了一下 不支持AVX指令集 因此是x4
bluesxn (站内联系TA)
5楼: Originally posted by zouming1979 at 2012-05-04 1300
e7-8837 我看了一下 不支持AVX指令集 因此是x4
这里关于每秒钟的浮点运算的次数做一个说明:
目前大多数的理论峰值是按照x4的来计算,因为通常cpu核可以一拍执行两条指令,每条指令可以执行两个操作,因此是x4。
intel新架构的处理器增加了新的指令集AVX,因此一条指令可以执行四个操作,故新架构的处理器.
AVX指令集
- 关于Float峰值计算的方法
- 关于Float峰值计算的方法
- LTE峰值速率的计算
- float计算不准确的替代方法
- 浮点性能峰值,带宽的计算
- 计算MySQL的内存峰值公式
- 计算MySQL的内存峰值公式
- 如何计算的LTE峰值数据率?
- 关于float,double等表示的数值范围的计算
- 应对电商大促峰值的九个方法
- 计算峰值带宽
- 使用差分法计算一段波的峰值、起始、终结位置
- 关于css的float
- 关于float计算结果不精确问题
- 关于float和Float的小提示
- Float 的isNan 方法
- 性能测试并发峰值计算
- LTE:下行峰值速率计算
- Android图表控件MPAndroidChart——曲线图LineChart的使用(多条曲线)
- 82. Remove Duplicates from Sorted List II
- Java 读取properties文件中文乱码,先确定properties文件类型
- 为什么python的yield第一次不能用send发送数据?
- Linux问题—解决umount.nfs: /data: device is busy
- 关于Float峰值计算的方法
- HDU5924-Mr. Frog’s Problem
- 【已解决】win10环境下基于nltk搭建stanford parser环境,进行中文依存句法分析
- JS 左侧折叠效果
- ejabberd配置数据库(其他数据库类似操作)
- Linux — 线程安全和可重入函数
- git分布式版本控制系统原理以及常用命令的使用
- Java并发编程:同步容器、并发容器和阻塞队列
- web安全测试