由float类型与0比较学习浮点型编码格式

来源：互联网发布：淘宝秋季女装新款特卖编辑：程序博客网时间：2024/04/28 07:09

前一段时间读了一下林锐博士的《高质量C/C++编程指南》，其中有一个比较经典的问题。请写出float x与“零值”比较的if语句？

当时只知道不能直接用float类型的值与0进行“==”或“!=”比较，但不知道该具体怎么写这个if语句。看过答案才知道，应该设法转化成“>=”或“<=”，即：

const float EPSINON = 0.00001;

if((x >= - EPSINON) && (x <= EPSINON))

看了答案后觉得很有道理，然后就记了答案，算是取得了“真经”了。

最近，我和项目组同事讨论问题的时候，正好涉及到这个问题。我马上想到自己的“真经”，炫耀地说出了标准答案，可同事问了句为什么，为什么是0.00001？我马上哑炮了。终于体会那句话，凡事认真追问起来，都不简单。

事情要知其然，还要知其所以然。马上编了个小程序验证了一把。

#include<stdio.h>

int main()

{

float f = 1.0;

float f1 = f/3; // f1 = 1/3

float f2 = f1*3; // f2 = 1;

float f_result = f1 - f2/3; // f_result = 0 ???

if(0.0f == f_result)

{

printf("f_result == 0/n");

}

else

{

printf("f_result != 0/n");

}

return 0;

}

通过上述程序，可以明确得到答案，但具体为什么如此，还需要从C语言中float类型变量的编码格式说起。

浮点数表示形如V=x * 2^y 的有理数进行编码，IEEE标准754仔细制定了浮点数及其运算的标准。

十进制的12.34可以这样表示：1*10^1 + 2*10^0 + 3*10^-1 + 4*10^-2。同样地，二进制的101.11可以这样表示：1*2^2 + 1*2^0 + 1*2^-1 +1*2^-2 。注意而今之中形如0.111…1正好是小于1的数。假定只用有限长度的编码，那么十进制是不能准确表示想1/3、5/7这样的数的，类似的，小数的二进制表示法只能表示那些能够被写成x * 2^y的数，其他的只能用近似数来表示。

IEEE浮点标准用V=(-1)^s * M * 2^E的形式来表示一个数：

（1）符号（sign）s决定数是负数（s=1）还是正数（s=0），而对0的符号位作为特殊情况处理。

（2）有效数（significant）M是一个二进制小数。

（3）指数（exponent）E是2的幂（可能是负数），他的作用是对浮点数的加权。

一个浮点数的位表示按上述情形划分为3个域。

标准C语言中，单精度float浮点格式的符号位=1，有效位=23，指数未=8，产生一个32位的表示。双精度double浮点格式的符号位=1，有效位=52，指数位=11，产生一个64位的表示。

根据指数位的值，被编码的值可以分为三种不同的情况，即，规格化值、非规格化值、特殊数值。当指数的为不全为0且不全为1时，属于规格化值；当指数位全为0时，属于非规格化值；当指数位全为1时，属于特殊数值。下面主要了解一下后两者情况。

非规格化值有两个目的。首先提供了一种表示数值0的方法当小数位也全为0时，可以根据符号位的不同表示+0.0和-0.0。另外一个功能是用来表示那些非常接近0.0的数，使用逐渐下溢出（gradual underflow）的方法实现这个属性。特殊数值当指数位全为1，而小数位全为0时，可以表示正无穷大和负无穷大。当小数位为非零时，结果值被称为NaN。

因为表示方法限制了浮点数的范围和精度，所以浮点运算只能近似地表示实数运算。系统需要使用“最接近”匹配值的值保存浮点值，这就是舍入（rounding）运算的任务。IEEE规定了四种舍入方式，默认的方式是向偶数舍入，也叫向最接近的值舍入。