用 Haskell 编写的解析器未按预期工作

Parser written in Haskell not working as intended

我在玩 Haskell 的 parsec 库。我试图将 "#x[0-9A-Fa-f]*" 形式的十六进制字符串解析为整数。这是我认为可行的代码:

module Main where

import Control.Monad
import Numeric
import System.Environment
import Text.ParserCombinators.Parsec hiding (spaces)

parseHex :: Parser Integer
parseHex = do
  string "#x"
  x <- many1 hexDigit
  return (fst (head (readHex x)))

testHex :: String -> String
testHex input = case parse parseHex "lisp" input of
  Left err -> "Does not match " ++ show err
  Right val -> "Matched" ++ show val

main :: IO ()
main = do
  args <- getArgs
  putStrLn (testHex (head args))

然后我尝试在 Haskell 的 repl 中测试 testHex 函数:

GHCi, version 8.6.5: http://www.haskell.org/ghc/  :? for help
[1 of 1] Compiling Main             ( src/Main.hs, interpreted )
Ok, one module loaded.
*Main> testHex "#xcafebeef"
"Matched3405692655"
*Main> testHex "#xnothx"
"Does not match \"lisp\" (line 1, column 3):\nunexpected \"n\"\nexpecting hexadecimal digit"
*Main> testHex "#xcafexbeef"
"Matched51966"

第一次和第二次尝试按预期工作。但在第三个中,字符串匹配到无效字符。我不希望解析器执行此操作,但如果字符串中的任何数字不是有效字符串,则不匹配。为什么会发生这种情况,如果解决这个问题怎么办?

谢谢!

你需要把eof放在最后。

parseHex :: Parser Integer
parseHex = do
  string "#x"
  x <- many1 hexDigit
  eof
  return (fst (head (readHex x)))

或者,如果您想在其他地方重复使用 parseHex,您可以将它与 eof 组合在一起。

testHex :: String -> String
testHex input = case parse (parseHex <* eof) "lisp" input of
  Left err -> "Does not match " ++ show err
  Right val -> "Matched" ++ show val