C#解惑34: 被计数击倒了

来源:互联网 发布:thinkphp3.2案例源码 编辑:程序博客网 时间:2024/05/03 04:24
谜题34: 被计数击倒了
    这个程序会打印什么呢?
    class Count
    {
      static void Main()
      {
        const int START = 2000000000;
        int count = 0;
        for (float f = START; f < START + 50; f++)
          count++;
        System.Console.WriteLine(count);
      }
    }

解惑34: 被计数击倒了
    经过表面的分析也许会认为这个程序将打印50,毕竟,循环变量(f)被初始化为2,000,000,000,而终止值比初始值大50,并且这个循环具有传统的“半开”形式:它使用的是<操作符,这使得它包括初始值但是不包括终止值。
    然而,这种分析遗漏了关键的一点:循环变量是float类型的,而非int类型的。回想一下谜题28,很明显,增量操作(f++)不能正常工作。f的初始值接近int.MaxValue,因此它需要用31位来精确表示,而float类型只能提供24位的精度。对如此巨大的float数值进行增量操作将不会改变其值。因此,这个程序看起来应该无限地循环下去,因为f永远也不可能接近终止值。但是,运行该程序,就会发现它并没有无限循环下去,事实上,它立即就终止了,并打印0。怎么回事呢?
    问题在于终止条件测试失败了,其方式与增量操作失败的方式非常相似。这个循环只有在循环索引f比(float)(START + 50)小的情况下才运行。在将一个int与一个float进行比较时,会自动执行从int到float的提升[C#语言规范 7.2.6.2]。遗憾的是,这种提升是会导致精度丢失的六种隐式数值转换之一[C#语言规范 6.1.2]
    f的初始值太大了,以至于加上50,然后转型为float时,所产生的数值等于直接将f转换成float的数值。换名话说,(float)2000000000 == 2000000050,因此表达式f < START + 50在第一次执行循环体之前就是false,所以,循环体也就永远没有机会去运行。
    改正这个程序非常简单,只需将循环变量的类型从float改为int即可。这样就避免了所有与浮点计算有关的不精确性:
    for (int f = START; f < START + 50; f++)
      count++;
    如果不使用计算机,如何才能知道2,000,000,050与2,000,000,000有相同的float表示呢?关键是要观察到2,000,000,000有10个因子2:它是一个2乘以9个10,而每个10都是5×2。这意味着2,000,000,000的二进制表示是以10个0结尾的。50的二进制表示只需要6位,所以将50加到2,000,000,000上不会对右边6位之外的其他位产生影响。特别是,从右边数过来的第7位和第8位仍旧是0。提升这个31位的int到具有24位精度的float会在第7位和第8位之间四舍五入,从而直接舍弃最右边的7位。而最右边的6位是2,000,000,000与2,000,000,050的不同之处,因此它们的float表示是相同的。
    这个谜题寓意很简单:不要使用浮点数作为循环索引,因为它会导致无法预测的行为。如果在循环体内需要一个浮点数,那么请使用int或long循环索引,并将其转换为float或double。在将一个int或long转换成一个float或double时,可能会丢失精度,但是至少它不会影响循环本身。当使用浮点数时,要使用double而不是float,除非你肯定float提供了足够的精度,并且存在强制性的性能需求迫使你使用float。适合使用float而不是double的时刻是非常非常少的。
    对语言设计者的教训仍然是,对程序员来说悄悄地丢失精度是非常混乱的。请查看谜题31有关这一点的深入讨论。
0 0