【QT】float double的范围与精度及Qt中的qfloat16

来源：互联网发布：老版书旗小说软件编辑：程序博客网时间：2024/06/06 12:41

1、格式

float和double都是浮点数据类型，前者为单精度占四个字节，后者为双精度占八个字节。浮点数的存储格式采用IEEE标准，float包括1个符号位、8个指数位和23个尾数位，double包括1个符号位、11个指数位和52个尾数位，其中符号位表示正负，为1时表示负数，为0时表示正数。

2、范围

浮点数的范围由指数决定，以float为例，指数共8个二进制位，以无符号形式存储，指数范围为0~255，但实际的指数值需要减去127，也就是说实际的指数范围为-127~128，其中负指数决定了浮点数绝对值最小的非零值，正指数决定了浮点数绝对值的最大值即取值范围，所以float的范围为-2^128~2^128，换算成十进制科学计数法为-3.40e+38~3.40e+38。同理，double的指数范围为-1023~1024，取值范围为-2^1024~2^1024，即-1.79e+308~1.79e+308。另外，浮点数的最小值可以说是几乎等于0，无限接近于0但不等于0，float和double的最小值理论上是不等的。

3、精度

浮点数的精度由尾数决定，由于是以科学记数法存储的，所以整数部分总是隐含着一个1但对精度没有影响，以float为例，尾数共23个二进制位，2^23=8388608，共7位，所以精度为6~7位有效数字。同理，double的2^52=4503599627370496共16位，所以精度为15~16位有效数字。

4、例子

下面是float的一个例子。

十进制 -5.625 = 十六进制 C0B4 0000转换成二进制为1100 0000 1011 0100 0000 0000 0000 0000按照浮点数格式（1个符号位+8个指数位+23个尾数位）划分为1 1000 0001 01101 000000000000000000其中，符号1表示负数；指数1000 0001即129，减去127为2； 尾数01101 000000000000000000即01101，加上隐含的整数部分为1.101101。所以，最后的结果= -1.01101 × 2^2= -(1*2^0 + 1*2^(-2) + 1*2^(-3) + 1*2^(-5)) * 2^2= -(1+0.25+0.125+0.03125) * 4= -1.40625 * 4= -5.625

5、Qt

在Qt中，除了标准的数据类型包括浮点类型之外，还typedef了一些其它类型，其实就是给标准类型换个好认的名称而已。以qreal为例，在Qt中浮点类型用qreal表示，可能为float或double，如下所示：

#if defined(QT_COORD_TYPE)typedef QT_COORD_TYPE qreal;#elsetypedef double qreal;#endif

Qt还提供了特殊的半精度浮点类型qfloat16，遵循IEEE754标准，1个符号位、5个指数位和10个尾数位，内部用quint16即unsigned short进行存储，如下所示：

class qfloat16{public:#ifndef Q_QDOC    Q_DECL_CONSTEXPR inline qfloat16() Q_DECL_NOTHROW : b16(0) { }    inline qfloat16(float f) Q_DECL_NOTHROW;    inline operator float() const Q_DECL_NOTHROW;#endifprivate:    quint16 b16;    Q_CORE_EXPORT static const quint32 mantissatable[];    Q_CORE_EXPORT static const quint32 exponenttable[];    Q_CORE_EXPORT static const quint32 offsettable[];    Q_CORE_EXPORT static const quint32 basetable[];    Q_CORE_EXPORT static const quint32 shifttable[];    friend bool qIsNull(qfloat16 f) Q_DECL_NOTHROW;    friend qfloat16 operator-(qfloat16 a) Q_DECL_NOTHROW;};

在对qfloat16进行处理时，通过重载的operator float()及static_cast把qfloat16转换成了float进行处理，根据其存储格式实现了如下几个函数：

bool qFuzzyCompare(qfloat16 p1, qfloat16 p2);bool qIsFinite(qfloat16 f);bool qIsInf(qfloat16 f);bool qIsNaN(qfloat16 f);qint64 qRound64(qfloat16 value);int qRound(qfloat16 value);

阅读全文

1 0