Python 为什么不解决四舍五入(round)的“bug”
来源:互联网 发布:健康风险评估软件 编辑:程序博客网 时间:2024/05/01 08:34
链接:https://www.zhihu.com/question/20128906/answer/38215332
来源:知乎
著作权归作者所有,转载请联系作者获得授权。
先看一个现象,和 round 无关的:
>>> def show(x):... """打印一个数,20 位精度"""... print('{:.20f}'.format(x))...>>> show(1.5)1.50000000000000000000>>> show(1.25)1.25000000000000000000>>> show(1.245)1.24500000000000010658>>> show(1.45)1.44999999999999995559>>> show(1.415)1.41500000000000003553
从数学上看,一个既约分数(有理数)n/d 要表示为 B 进制数,如果 d 的所有素因子都整除 B,就说明存在一个整数 k,使得分母 d 整除 B^k——比如 q * d = B^k,于是此时有 n/d = n / (B^k / q) = nq / B^k,也就是说 n/d 可以使用至多 k 位数的 B 进制小数有限表示。
反之,也容易证明,如果 d 有素因子不能整数 B,那么就不存在上面的 k,也就是说有理数 n/d 不可能由有限位数的 B 进制数表示。——也就是说会出现循环小数。
对于 10 进制数,所有分母只有素因子 2 和 5 的有理数,都能表示为有限小数。比如 1/2 是 0.5,1/4 是 0.25,1/5 是 0.2,3/8 是 0.375,都是有限的。
而对于 2 进制数,分母里面只有素因子 2 的有理数,才能表示为有限小数。所以 1/2 是 0.1,1/4 是 0.01,3/8 是 0.011。但 1/5 就不能用有限二进制数表示了,是个循环小数 0.0011 0011 0011……。
(什么,你问无理数?小学生都知道无理数是无限不循环小数。)
现在:
- 计算机的浮点数是用小数表示的。浮点数就是科学计数法,指数部分是个整数,尾数部分是个小数。
- 计算机的存储是有限的,所以只能使用有限位数的小数表示。
- 计算机硬件通常是用二进制运算的。
具体到 Python 的 float,C/C++ 的 float/double,都是有限长度的、二进制、浮点数。准确地说,是这个:IEEE floating point
现在问题来了。人写程序用十进制数,计算机运行程序用二进制数,怎么办?转换呗。
从概念上说,就是我写:
a(10) = 0.5
计算机读:
a(2) = 0.1
我写:
b(10) = 0.375
计算机读
b(2) = 0.011
可如果我写
c(10) = 0.2
计算机就只能读成了有限位数,比如 12 位:
c(2) = 0.0011 0011 0011(咔嚓切断)
其实这个被截断保留 12 位二制制位的数用十进制表示是 0.199951171875,已经不准了。你说不对呀这个小了,最后一位能不能加上去,让计算机读成
c(2) = 0.0011 0011 0100(进了一位)
这个数用十进制表示则是 0.2001953125,又大了。
——实际的计算机中,python 的 float 是用 64 位浮点数,其中 53 位是尾数部分,误差小得多了,但还是不可能没有。
所以,计算机在把人写的程序转换为内部代码的时候,就必须做十进制到二进制的转换。这个转换就已经不得不带来误差了。当然,像前面说的,不是所有的数都有误差,0.5、3.75、78.625 都不会有误差,但简单的 0.2、3.15 就会有进制转换误差。
所以,在开始计算 round 这个四舍五入的函数之前,在程序刚被读入计算机时,这个变量的值早已经不精确了。round 又能解决什么问题?
话说回来,round 本身在一些情况下是准确的。比如 0.5、1.5、2.5、3.5 这些数,都能用有限位二进制数表示,它们直接 round 的结果也都是准确的,不过使用的不是四舍五入而是无偏算法(把 0.5 向偶数而不是向上舍入,这里指 Python 3)。round 在另一些情况下又可能是不准确的,因为 Python 的 round 有两个参数,第二个参数表示舍入到第几位,就需要对原数先计算再舍入,就不准确了。
如果让 Python 减慢速度,也在内部用十进制表示和计算,就不会出现进制转换和移位这种来源的舍入误差,此时做舍入运算或输入输出就是精确的了。虽然这不能防止其他计算(比如除法、三角函数)带来的误差,但在一些场合,比如金融算钱的时候,还是非常有用的。在 Python 里面可以用 decimal 包来使用十进制浮点数,避免输入输出的带来的进制转换误差,按十进制移位时除法带来的误差等。
小结:
- 误差主要来自输入时十进制转换为计算机内部二进制时,且这个问题在有限精度下不可能解决,也不需要解决。
- round 可以准确舍入,但它涉及的移位计算也可能带来其他误差。
- Python 的 decimal 包可用于解决这一问题。
- Python 为什么不解决四舍五入(round)的“bug”
- [Python]round四舍五入精度缺失的解决
- Delphi中取整函数Round的Bug解决
- SQL的四舍五入ROUND函数
- Math.Round 不同的四舍五入
- Math.round()的四舍五入问题
- SQL的四舍五入ROUND函数
- Math.round四舍五入的理解
- python round函数并不是"四舍五入"
- python: round 内建函数 (四舍五入)
- 解决IE6背景图片不缓存的BUG
- 解决IE6背景图片不缓存的BUG
- 解决IE6背景图片不缓存的BUG
- python下的四舍五入
- Round 四舍五入
- 四舍五入round()
- 解决access中round函数不能正确四舍五入的问题 (备忘)
- 为什么用ROUND四舍五入总是无法得到正确数值?
- android radioButton 选中后改变字体颜色样式
- 移动端开发者眼中的前端开发流程变迁与前后端分离
- Android之Adapter的封装与抽象(三)
- JavaWeb:报错信息The superclass "javax.servlet.http.HttpServlet" was not found on the Java Build Path
- 一个特殊的日子(20160801-0001)
- Python 为什么不解决四舍五入(round)的“bug”
- text——为android系统添加一种默认字体,类似“sans”,“serif”,“monospace”
- C#中的MessageBox消息对话框
- gc overhead limit exceeded eclipse错误解决方案
- 有限元漫谈
- Win10上MySQL免安装版配置及1067error解决办法
- Error:(1, 1) 错误: 非法字符: \65279 Error:(1, 10) 错误: 需要class, interface或enum Error:(1, 1) 错误: 非法字符: \6527
- 如何建立与Olingo V4 OData服务
- C++中static应用详解