Java 编译器文本到浮点值的转换是否与 strtod 不同?
Does the Java compilers text-to-float value conversion differ from strtod?
Java 语言规范 point 3.10.2 声明浮点值按照 IEEE 754 标准中的规定进行转换。对于 strtod
,C 标准指定函数如何将文本转换为浮点值。关于表示本身,两者似乎涵盖相同的情况。我不确定的是,舍入规则如何? Java 编译器执行的转换是否与 strtod
执行的不同?
背景是我想编译成 Java 字节码代码,因此需要将 float/double 值的文本表示转换为 class 文件中的表示。
例如,此 Java 代码打印出更精确的值:
double value = 1.23412991913372577889911;
System.out.println(value);
// Output: 1.2341299191337258
使用 strtod 转换相同的值并将其打印出来打印一个不太精确的值:
const char* textual = "1.23412991913372577889911";
double result = strtod(textual, ...);
std::cout << result << std::endl;
// Output: 1.23413
这是一个输出问题,还是值实际上以不同的方式转换?
编辑: 正如 Pascal Cuoq 评论的那样,当以完全精确的方式打印出值时(我通过设置 std::cout.precision()
这样做),值是相等的,所以我假设转换导致相同的值。我想我会为此做一个测试。 :-)
是的,有区别。这是我能找到的两个。
Java 支持数字之间的下划线。来自规范:
Underscores are allowed as separators between digits that denote the whole-number part, and between digits that denote the fraction part, and between digits that denote the exponent.
对于您的情况,这应该不是问题。您只需去除所有下划线。
Java 强制执行 IEEE 754 浮点运算的舍入到最近规则。来自 Java spec(语言规范指的是 Double.valueOf
):
[This] exact numerical value is then conceptually converted to an "infinitely precise" binary value that is then rounded to type double by the usual round-to-nearest rule of IEEE 754 floating-point arithmetic, which includes preserving the sign of a zero value.
strtod
的舍入模式是实现定义的,IIUC 甚至允许 1 ULP 的误差。来自 C99 规范(strtod
文档参考第 6.4.4.2 节):
For decimal floating constants, and also for hexadecimal floating constants when FLT_RADIX is not a power of 2, the result is either the nearest representable value, or the larger or smaller representable value immediately adjacent to the nearest representable value, chosen in an implementation-defined manner.
仅当您的 C 编译器支持 附件 F:IEC 60559 浮点运算,strtod
才能保证符合 IEEE 754(IEC 60559 和 IEEE 754 是等效):
The translation time conversion of floating constants and the strtod, strtof, strtold, fprintf, fscanf, and related library functions in <stdlib.h>, <stdio.h>, and <wchar.h> provide IEC 60559 binary-decimal conversions.
另请注意,strtod
仅自 C99 起支持十六进制浮点表示法(Java 自版本 5 起)。因此,请检查 strtod
的实施方式。
Java 语言规范 point 3.10.2 声明浮点值按照 IEEE 754 标准中的规定进行转换。对于 strtod
,C 标准指定函数如何将文本转换为浮点值。关于表示本身,两者似乎涵盖相同的情况。我不确定的是,舍入规则如何? Java 编译器执行的转换是否与 strtod
执行的不同?
背景是我想编译成 Java 字节码代码,因此需要将 float/double 值的文本表示转换为 class 文件中的表示。
例如,此 Java 代码打印出更精确的值:
double value = 1.23412991913372577889911;
System.out.println(value);
// Output: 1.2341299191337258
使用 strtod 转换相同的值并将其打印出来打印一个不太精确的值:
const char* textual = "1.23412991913372577889911";
double result = strtod(textual, ...);
std::cout << result << std::endl;
// Output: 1.23413
这是一个输出问题,还是值实际上以不同的方式转换?
编辑: 正如 Pascal Cuoq 评论的那样,当以完全精确的方式打印出值时(我通过设置 std::cout.precision()
这样做),值是相等的,所以我假设转换导致相同的值。我想我会为此做一个测试。 :-)
是的,有区别。这是我能找到的两个。
Java 支持数字之间的下划线。来自规范:
Underscores are allowed as separators between digits that denote the whole-number part, and between digits that denote the fraction part, and between digits that denote the exponent.
对于您的情况,这应该不是问题。您只需去除所有下划线。
Java 强制执行 IEEE 754 浮点运算的舍入到最近规则。来自 Java spec(语言规范指的是
Double.valueOf
):[This] exact numerical value is then conceptually converted to an "infinitely precise" binary value that is then rounded to type double by the usual round-to-nearest rule of IEEE 754 floating-point arithmetic, which includes preserving the sign of a zero value.
strtod
的舍入模式是实现定义的,IIUC 甚至允许 1 ULP 的误差。来自 C99 规范(strtod
文档参考第 6.4.4.2 节):For decimal floating constants, and also for hexadecimal floating constants when FLT_RADIX is not a power of 2, the result is either the nearest representable value, or the larger or smaller representable value immediately adjacent to the nearest representable value, chosen in an implementation-defined manner.
仅当您的 C 编译器支持 附件 F:IEC 60559 浮点运算,
strtod
才能保证符合 IEEE 754(IEC 60559 和 IEEE 754 是等效):The translation time conversion of floating constants and the strtod, strtof, strtold, fprintf, fscanf, and related library functions in <stdlib.h>, <stdio.h>, and <wchar.h> provide IEC 60559 binary-decimal conversions.
另请注意,strtod
仅自 C99 起支持十六进制浮点表示法(Java 自版本 5 起)。因此,请检查 strtod
的实施方式。