java精度思考(1)

来源：互联网发布：ide java vim 编辑：程序博客网时间：2024/04/30 15:19

问题:

public class FloatDoubleTest {  public static void main(String[] args) {   float f = 20014999;   double d = f;   double d2 = 20014999;   System.out.println("f=" + f);   System.out.println("d=" + d);   System.out.println("d2=" + d2);  }}

得到的结果如下：
f=2.0015E7
d=2.0015E7
d2=2.0014999E7

从输出结果可以看出double 可以正确的表示20014999 ，而float 没有办法表示20014999 ，得到的只是一个近似值。这样的结果很让人讶异。20014999 这么小的数字在float下没办法表示。于是带着这个问题，做了一次关于float和double学习，做个简单分享，希望有助于大家对java 浮点数的理解。

关于 java 的 float 和 double

Java 语言支持两种基本的浮点类型： float 和 double 。java 的浮点类型都依据IEEE 754 标准。IEEE 754 定义了32位和 64 位双精度两种浮点二进制小数标准。

IEEE 754用科学记数法以底数为 2 的小数来表示浮点数。32位浮点数用 1 位表示数字的符号，用 8 位来表示指数，用 23 位来表示尾数，即小数部分。作为有符号整数的指数可以有正负之分。小数部分用二进制（底数2 ）小数来表示。对于64 位双精度浮点数，用1 位表示数字的符号，用 11 位表示指数，52 位表示尾数。如下两个图来表示：

float(32位):

double(64位):

都是分为三个部分：

(1) 一个单独的符号位s 直接编码符号s 。

(2)k 位的幂指数E ，移码表示。

(3)n 位的小数，原码表示。

那么20014999为什么用 float没有办法正确表示？

结合float和double的表示方法，通过分析20014999的二进制表示就可以知道答案了。

以下程序可以得出20014999在double和float下的二进制表示方式。

double d = 20014999;long l = Double.doubleToLongBits(d);System.out.println(Long.toBinaryString(l));float f = 20014999;int i = Float.floatToIntBits(f);System.out.println(Integer.toBinaryString(i));

输出结果如下：

Double:100000101110011000101100111100101110000000000000000000000000000

Float: 1001011100110001011001111001100

对于输出结果分析如下。对于double的二进制左边补上符号位0刚好可以得到64位的二进制数。根据double的表示法，分为符号数、幂指数和尾数三个部分如下：

010000010111 0011000101100111100101110000000000000000000000000000

对于float 左边补上符号位0 刚好可以得到32 位的二进制数。根据float的表示法，也分为符号数、幂指数和尾数三个部分如下：

010010111 00110001011001111001100

绿色部分是符号位，红色部分是幂指数，蓝色部分是尾数。

对比可以得出:符号位都是0 ，幂指数为移码表示,两者刚好也相等。唯一不同的是尾数。

在double 的尾数为：001100010110011110010111 0000000000000000000000000000，省略后面的零，至少需要24位才能正确表示。

而在float 下面尾数为：00110001011001111001100，共 23位。

为什么会这样？原因很明显，因为float尾数最多只能表示23 位，所以24 位的001100010110011110010111 在float 下面经过四舍五入变成了23 位的00110001011001111001100 。所以20014999 在float 下面变成了20015000 。
也就是说 20014999虽然是在float的表示范围之内，但在IEEE 754 的float 表示法精度长度没有办法表示出20014999 ，而只能通过四舍五入得到一个近似值。

总结：

浮点运算很少是精确的，只要是超过精度能表示的范围就会产生误差。往往产生误差不是因为数的大小，而是因为数的精度。因此，产生的结果接近但不等于想要的结果。尤其在使用float 和double 作精确运算的时候要特别小心。
可以考虑采用一些替代方案来实现。如通过 String 结合BigDecimal 或者通过使用long 类型来转换。