浮点数、精度和秒差距

Question

考虑以下代码：

import Text.Parsec
import Text.Parsec.Language
import Text.Parsec.String
import qualified Text.Parsec.Token as Token

float :: Parser Double
float = Token.float (Token.makeTokenParser emptyDef)

myTest :: String -> Either ParseError Double
myTest = parse float ""

现在，多亏了 QuickCheck，我知道了一个幻数（我已经将结果对齐了方便):

λ> myTest "4.23808622486133"
Right      4.2380862248613305

有些浮点数不能在内存中精确表示，有些操作很容易将“波动”引入浮点数。我们都知道。但是，这个解析问题的原因似乎有所不同。

关于帮助我发现此…功能的测试的几句话。简单地说，在这些测试中，生成、打印并解析回浮点值（与秒差距）。例如，已知数字 9.2 不可能表示为浮动点值, 然而它通过了测试（显然是因为“智能”打印功能）。为什么 4.23808622486133 失败？

对于那些认为这些数字相同并且 4.23808622486133 只是 4.2380862248613305 的最短明确表示的人：

a1 :: Double
a1 = 9.2000000000000003

a2 :: Double
a2 = 9.200000000000001

b1 :: Double
b1 = 4.23808622486133

b2 :: Double
b2 = 4.2380862248613305

现在：

λ> a1 == a2
True
λ> b1 == b2
False

Answer 1

Parsec 使用等于

的量转换为 Double

foldr (\d acc -> read [d] + acc / 10) 0 "423808622486133" :: Double

正如您所指出的，这不等于

423808622486133 / 100000000000000 :: Double

我同意这应该被视为 Parsec 中的错误。

Answer 2

这在 Parsec 中仍未修复。如果这个确切的问题让你一整天都不开心，请查看 Megaparsec，它是 Parsec 的一个分支，修复了许多错误和概念缺陷，提高了错误消息的质量等等。

如您所见，此问题已解决：

λ> parseTest float "4.23808622486133"
4.23808622486133
λ> parseTest float "4.2380862248613305"
4.2380862248613305

披露：我是 Megaparsec 的作者之一。

浮点数、精度和秒差距

Floating point numbers, precision, and Parsec

floating-point

haskell

parsec