由float类型与0比较学习浮点型编码格式

来源:互联网 发布:淘宝秋季女装新款特卖 编辑:程序博客网 时间:2024/04/28 07:09

前一段时间读了一下林锐博士的《高质量C/C++编程指南》,其中有一个比较经典的问题。请写出float x与“零值”比较的if语句?

当时只知道不能直接用float类型的值与0进行“==”或“!=”比较,但不知道该具体怎么写这个if语句。看过答案才知道,应该设法转化成“>=”或“<=”,即:

const float EPSINON = 0.00001;

if((x >= - EPSINON) && (x <= EPSINON))

看了答案后觉得很有道理,然后就记了答案,算是取得了“真经”了。

 

最近,我和项目组同事讨论问题的时候,正好涉及到这个问题。我马上想到自己的“真经”,炫耀地说出了标准答案,可同事问了句为什么,为什么是0.00001?我马上哑炮了。终于体会那句话,凡事认真追问起来,都不简单。

 

事情要知其然,还要知其所以然。马上编了个小程序验证了一把。

#include<stdio.h>

int main()

{

       float f = 1.0;

       float f1 = f/3;                              // f1 = 1/3

       float f2 = f1*3;                        // f2 = 1;

       float f_result = f1 - f2/3;      // f_result = 0 ???

      

       if(0.0f == f_result)

       {

              printf("f_result == 0/n");

       }

       else

       {

              printf("f_result != 0/n");

       }

      

       return 0;

}

 

通过上述程序,可以明确得到答案,但具体为什么如此,还需要从C语言中float类型变量的编码格式说起。

 

浮点数表示形如V=x * 2^y 的有理数进行编码,IEEE标准754仔细制定了浮点数及其运算的标准。

 

十进制的12.34可以这样表示:1*10^1 + 2*10^0 + 3*10^-1 + 4*10^-2。同样地,二进制的101.11可以这样表示:1*2^2 + 1*2^0 + 1*2^-1 +1*2^-2 。注意而今之中形如0.111…1正好是小于1的数。假定只用有限长度的编码,那么十进制是不能准确表示想1/35/7这样的数的,类似的,小数的二进制表示法只能表示那些能够被写成x * 2^y的数,其他的只能用近似数来表示。

 

IEEE浮点标准用V=(-1)^s * M * 2^E的形式来表示一个数:

1)符号(signs决定数是负数(s=1)还是正数(s=0),而对0的符号位作为特殊情况处理。

2)有效数(significantM是一个二进制小数。

3)指数(exponentE2的幂(可能是负数),他的作用是对浮点数的加权。

一个浮点数的位表示按上述情形划分为3个域。

 

标准C语言中,单精度float浮点格式的符号位=1,有效位=23,指数未=8,产生一个32位的表示。双精度double浮点格式的符号位=1,有效位=52,指数位=11,产生一个64位的表示。

 

根据指数位的值,被编码的值可以分为三种不同的情况,即,规格化值、非规格化值、特殊数值。当指数的为不全为0且不全为1时,属于规格化值;当指数位全为0时,属于非规格化值;当指数位全为1时,属于特殊数值。下面主要了解一下后两者情况。

 

非规格化值有两个目的。首先提供了一种表示数值0的方法当小数位也全为0时,可以根据符号位的不同表示+0.0-0.0。另外一个功能是用来表示那些非常接近0.0的数,使用逐渐下溢出(gradual underflow)的方法实现这个属性。特殊数值当指数位全为1,而小数位全为0时,可以表示正无穷大和负无穷大。当小数位为非零时,结果值被称为NaN

 

因为表示方法限制了浮点数的范围和精度,所以浮点运算只能近似地表示实数运算。系统需要使用“最接近”匹配值的值保存浮点值,这就是舍入(rounding)运算的任务。IEEE规定了四种舍入方式,默认的方式是向偶数舍入,也叫向最接近的值舍入。

原创粉丝点击