使用上下文无关文法解析期权差价订单字符串?

Using Context-Free Grammar To Parse Options Spread Order Strings?

我需要创建一个工具,以字符串格式读取期权价差顺序,并以人类可读的格式输出。

示例:

输入:

BUY +6 VERTICAL LUV 100 (Weeklys) 28 AUG 20 37.5/36.5 PUT @.49 LMT

输出:

VERTICAL
BUY +6 LUV 28 AUG 20 (Weeklys) 37.5 PUT
SELL -6 LUV 28 AUG 20 (Weeklys) 36.5 PUT
.49 DEBIT LMT

输入:

BUY +1 DIAGONAL AMGN 100 (Weeklys) 4 SEP 20/28 AUG 20 245/240 CALL @.07 LMT

输出:

DIAGONAL
BUY +1 AMGN 4 SEP 20 (Weeklys) 245 CALL
SELL +1 AMGN 28 AUG 20 (Weeklys) 240 CALL
-.07 CREDIT LMT

从表面上看,上下文无关文法似乎是表达各种语法的一个很好的解决方案(对角展开更复杂)。但是由于几乎没有上下文无关语法的经验,我不确定我将如何携带这些数字以及我将如何添加原始订单字符串中未明确提及的 SELL 订单。例如,假设卖出边是垂直价差。

即使您不是期权交易者,也希望这有意义 ;-) 这里的基本思想是翻译原始字符串需要一点智慧,而不仅仅是生成不同文本的问题。

欢迎任何见解和指点。

仅通过 2 个示例很难判断,但我的猜测是,使用 context-free 语法(特别是如果您几乎没有使用它们的经验)可能有点矫枉过正。语法本身可能足够简单,但您需要添加 'actions' 以将识别的输入转换为所需的输出,或者让解析器构建 syntax-tree 然后编写代码来提取数据从树中生成所需的输出。

捕获时使用正则表达式会更简单。例如,这里有一些 python3 代码几乎可以处理您的 2 个示例:

import sys, re

for line in sys.stdin:
    
    mo = re.fullmatch(r'BUY \+(\d+) (VERTICAL|DIAGONAL) (\S+) 100 \(Weeklys\) (\d+ \w+ \d+)(?:/(\d+ \w+ \d+))? ([\d.]+)/([\d.]+) (PUT|CALL) @(.\d+) LMT\n', line)
    (n_units, vert_or_diag, name, date1, date2, price1, price2, put_or_call, limit) = mo.groups()

    if vert_or_diag == 'VERTICAL':
        assert date2 is None
        date2 = date1

    print()
    print(vert_or_diag)
    print(f"BUY +{n_units} {name} {date1} (Weeklys) {price1} {put_or_call}")
    print(f"SELL -{n_units} {name} {date2} (Weeklys) {price2} {put_or_call}")
    print(f"{limit} DEBIT LMT")

它并不完美,因为问题没有完美说明(例如,不清楚是什么导致人类可读格式具有正 DEBIT 与负 CREDIT)。输入的 space 无疑比正则表达式当前处理的要大。

重点只是为了表明,根据给出的示例,正​​则表达式可以成为一般问题的紧凑解决方案。