Common Lisp Read Macro for "lazy infix or," 解构关键字

Common Lisp Read Macro for "lazy infix or," to destructure keywords

我有一个 Common Lisp reader 宏来解析“或”关系的 lazy/delayed 声明,使用由竖线字符(“|”)分隔的中缀语法以及标准列表括号和关键字文字。考虑形式 (:a :b|:c)——它表示一个由两部分组成的元组,其中第一个元素肯定是 :a,第二个元素是 :b 或 :c。例如,可以推断整个元组的有效形式是 (:a :b) 或 (:a :c).

我已经有了函数封装逻辑来解构读取宏之后的这些元组列表形式。但是在阅读时我需要解析像 :a|:b|:c 这样的形式,并用删除的管道标记它,比如 (:lazy-or :a :b :c)。中缀语法的使用纯粹是为了面向 reader 的形式;中缀形式是短暂的,并在阅读阶段尽快被丢弃,以支持标记为 :lazy-or.

的等效合法 lisp 形式

所以我制作了一个读取宏,它几乎可以正常工作,但目前需要在第一个 or-form 关键字元素之前使用额外的管道作为一种 reader 印记(我希望它根本没有必要),并且它目前无法使用嵌套括号或拼接符号推断出类似的形式作为等效(就像在算术中一样,2+(3*4) 是相同的顺序 -操作,等效形式,如 2+3*4).

宏(源自此处的“斜杠reader”:http://www.lispworks.com/documentation/HyperSpec/Body/f_rd_rd.htm):

 (defun pipe-reader (stream char)                                                                   
   (declare (ignore char))                                                                          
   `(:lazy-or .  ,(loop for dir = (read stream t nil t)                       
                   then (progn (read-char stream t nil t)                                           
                               (read stream t nil t))                         
                   collect dir                                                                      
                   while (eql (peek-char nil stream nil nil t) #\|))))                              
(set-macro-character #\| #'pipe-reader)  

此重写规则的预期目标是在读取时成为 applied/substituted: (macroexpand '(:a (:b | :c))) -> (:a (:lazy-or :b :c)) 或者,对于括号中未包含的变体形式也是如此(一种默认的操作顺序;空格不会产生影响): (macroexpand '(:a :b|:c)) -> (:a (:lazy-or :b :c)) (macroexpand '(:a :b | :c)) -> (:a (:lazy-or :b :c)) 嵌套表单应该直观地递归地呈现: (macroexpand '(:a (:b | (:c | :d)))) -> (:a (:lazy-or :b (:lazy-or :c :d)))

请注意,在基本形式的预期重写规则中 -- (macroexpand '(:a (:b | :c))) -> (:a (:lazy-or :b :c)) - - :a 不会加入到 or-form 中,因为它没有中缀管道运算符可以在那里加入它;它与 or 形式的结果一起存在于一种元组中。如前所述,这是这样的,在进一步评估惰性形式时,元组可以想象地产生 (:a :b) 或 (:a :c) - 上面暗示这两种形式都是以后解构的有效形式。

我很亲近。

问题是我不太明白,只有以下(使用上面的宏): (macroexpand '(:a |:b|:c )) -> (:A (:LAZY-OR :B :C)) (macroexpand '(:a :b |:d|:e|:f|:g)) -> (:A :B '(:LAZY-OR :D :E :F :G)) 它实际上完成了我打算做的大部分事情,它是一个功能性的基本解决方案:稍微修改执行规则以允许在读取时在中缀或表单的开头添加额外的管道,而无需将表单连接到左侧该管道,因此它可以使 :b 到 :c(第一种形式)或 :d 到 :g(第二种形式)成为为 :lazy-or 形式列出的有效情况,并使该内部列表本身成为外部 list/tuple 以及非变体值 :a 和 :b。 它接近我想要的: (macroexpand '(:a :b :d|:e|:f|:g)) -> 应该,不 -> (:A :B '(:LAZY-OR :D :E :F :G) )

有 3 个错误,按重要性排序:

  1. 需要额外的“前缀”管道

    在读取每个 or-form 开始时额外的开始管道,我不想用。为了清洁和我自己的可读性偏好,我想切断那个管道,并且只在这个读取宏的完全中缀位置使用管道。

  2. 在递归解析时向嵌套表单添加了额外的括号

    它为嵌套表单添加了额外的括号,尽管它以其他方式很好地递归处理了嵌套表单。

  3. 不接受任意空格

    它不接受管道之间的空格。我尝试使用 read-preserving-whitespace 而不是 read,但在这里无济于事。它应该接受管道和关键字形式之间的空格,就好像它们不存在一样,因为形式 :a|:b:a | :b 是等效的。

read宏主要是对工作逻辑进行封装,擅长递归和嵌套形式: (macroexpand '(:a |(|:b|:c)|(|:e|:f))) -> 收益率 -> (:A (:LAZY-OR ((:LAZY-OR :B :C) ) ((:LAZY-OR :E :F))))
;(几乎完美,完全按照预期递归扩展,除了需要开始管道之外,这种形式的唯一问题是在最终 :lazy-or 形式周围生成的双括号)。 这样就可以从这种形式中生成相同的形式(当前是“不平衡”读取括号错误): (macroexpand '(:a (:b | :c) | (:e | :f))) -> 应该,不会屈服 -> (:A (:LAZY-OR (:LAZY-OR :B :C) (:LAZY-OR :E :F)))

除了 read 宏添加的额外括号,以及它不允许在中缀形式中使用空格之外,真正关键的错误是无法在不包含第一个的情况下将 or 形式编写为中缀管道形式,非中缀管道(顺便说一下前缀)。我真的 运行 碰壁试图匹配流而不需要使用第一个管道字符作为读取解析器的一种印记。也许对其中一个“peek”函数进行一两次额外调用会给我一种更专业的匹配形式,但我一直无法弄清楚如何解析它。

我着眼于围绕 NKF(“definfix”宏,https://www.cliki.net/infix) and CMU infix (https://github.com/rigetti/cmu-infix/blob/master/src/cmu-infix.lisp)等现有综合解决方案构建它,但由于这些是更通用的大型代码库,我认为我不需要为更多种类的 forms/operators 重用中缀逻辑,仅此一个。从我在一个相当小的宏上的接近程度来看,我肯定更愿意用一个小而简洁的解决方案来解决它,前提是它仍然是递归的并且不容易出错。

任何关于为此目的更有效地使用读取宏的观点将不胜感激。

我会尝试不同的方法并使用不同的字符作为备选列表,例如 [a|b],这样您就不需要前缀栏了。

例如:

;; a bar is now the symbol 'or
(set-macro-character #\| (constantly 'or))

;; read a list of forms for alternative forms
(set-macro-character #\[
                     (lambda (stream char)
                       (declare (ignore char))
                       `(lazy-or-parse
                         ,@(read-delimited-list #\] stream t))))

;; this one is required too so that e.g. `a]` is not read as a single symbol.
(set-macro-character #\]
                     (lambda (stream char)
                       (declare (ignore char))
                       (error "Unmatched closing bracket")))

有了上面的定义,下面的形式:

[:a|:b|:c]

读作:

(LAZY-OR-PARSE :A OR :B OR :C)

预计lazy-or-parse是一个宏。它的作用是解释一个标记列表,就像一个普通的解析器;您应该能够将它们分组为表达式(例如,像定义了 associativities/priorities 的 Pratt 解析器)。

或者,您仍然可以在 reader 宏中进行解析,但我个人更喜欢在这个阶段做尽可能少的工作。

注意。您需要调整 Emacs 以使其理解此语法,对于我使用 read-from-string:

的测试
(read-from-string "[a b (c|d)]")
(LAZY-OR-PARSE A B (C OR D))
11

I looked a bit 这是我在语法中更改的内容-table(这是 emacs-lisp 代码):

(modify-syntax-entry ?\[ "(]" lisp-mode-syntax-table)
(modify-syntax-entry ?\] ")[" lisp-mode-syntax-table)
(modify-syntax-entry ?| "_" lisp-mode-syntax-table)

经过这些修改,编辑器似乎可以识别语法,我什至可以这样写,将光标放在右括号之后,评估 last-sexp 并正确找到表达式的开头:

'[ a | (c | d)]
=> (LAZY-OR-PARSE A OR (C OR D))