浮点值的上溢和下溢 假设系统的最大float类型值是3.4E38,编写如下代码: float too big?3.4E38+100.0f; printf(“8eln”, toobia); 会发生什么?这是一个上溢(ovey/low)的示例。当计算导致数字过大,超过当前类型能袭达的范围时,就会发生上溢。这种行为在过去是未定义的,不过现在C语言规定,在这种情况下会给Eootrict。一个表示无穷大的特定值,而且printflú显示该值为inf或infinity(或者具有无穷含义的其他内容)。 当对一个很小的数做除法时,情况更为复杂。回忆一下,float类型的数以指数和尾数部分来存储。存在这样一个数,它的指数部分是最小值,尾数部分是由全部可用位表示的最小尾数值。该数字是flo或x类型能用全部精度表示的最小数字。现在把它除以2。通常,这个操作会减小指数部分,但是假设的情况中,指数已经是最小值了。所以计算机只好把尾数部分的位向右移,空出第1个二进制位,并丢弃最后一个二进制数。以十进制为例,把一个有4位有效数字的数(如,0,1234≤-10)除以10,得到的结果是0. 0123 E-10。虽然得到了结果,但是在计算过程中却损失了原末尾有效位上的数字。这种情况叫作下进(underfuow)。C语言把损失了类型全精度的浮点值称为低于正常的(subnormal)浮点值。因此,把最小的正浮点数除以2将得到一个低于正常的值。如果除以一个非常大的值,会导致所有的位都为0。现在C库已提供了用于检查计算是否会产生低于正常值的函数数。
还有另一个特殊的浮点值NaN(not a number的缩写)。例如,给asin()函数传递一个值,该函数将返回一个角度,该角度的正弦就是传入函数的值。但是正弦值不能大于1,因此,如果传入的参数大于1,该函数的行为是未定义的。在这种情况下,该函数将返回NaN值,printf()函数可将其显示为nan、NaN或其他类似的内容。 浮点数表示法 据前面介绍的知识,实现浮点数表示法的方法有多种。为了尽可能地统一实现,电子和电气工程师协会(IEEE)为浮点数计算和表示法开发了一套标准。现在,许多硬件浮点单元都采用该标准。2011年,该标准被ISO/ IECIEEE60559 :2011标准收录。该标准作为C99和C11的可选项,符合硬件要求的平台可开启。floaterr.c程序的第3个输出示例即是支持该浮点标准的系统显示的结果。支持C标准的编译器还包含捕获异常问题的工具。
|