标识符 Lexer 规则与它应该匹配的“*”不匹配

Question

我正在完成专有模式语言的语法。它借用了一些正则表达式语法元素（如量词），但它也比正则表达式复杂得多，因为它必须允许宏、不同的模式样式等。

我的问题是“*”与 ID 词法分析器规则不匹配。据我所知，没有其他规则可以吞下 * 令牌。

这是我写的语法：

grammar Pattern;

element:
        ID
        | macro;

macro:
        MACRONAME macroarg? ('*'|'+'|'?'|FROMTIL)?;

macroarg: '['( (element | MACROFREE ) ';')* (element | MACROFREE) ']';


and_con :
        element '&' element
        | and_con '&' element
        |'(' and_con ')';

head_con :
        'H[' block '=>' block ']';

expression :
        element
        | and_con
        | expression ' ' element
        | '(' expression ')';

block :
        element
        | and_con
        | or_con
        | '(' block ')';

blocksequence :
        (block ' '+)* block;

or_con :
         ((element | and_con) '|')+ (element | and_con)
        | or_con '|' (element | and_con)
        | '(' blocksequence (')|(' blocksequence)+ (')'|')*');

patternlist :
        (blocksequence ' '* ',' ' '*)* blocksequence;

sentenceord :
        'S=(' patternlist ')';

sentenceunord :
        'S={' patternlist '}';

pattern :
        sentenceord
        | sentenceunord
        |  blocksequence;      

multisentence :
        MS pattern;

clause :
        'CLS' ' '+ pattern;

complexpattern :
        pattern
        | multisentence
        | clause
        | SECTIONS ' ' complexpattern;

dictentry:
        NUM ';' complexpattern
        | NUM ';' NAME ';' complexpattern
        | COMMENT;

dictionary:
        (dictentry ('\r'|'\n'))* (dictentry)?;

ID : '*' ('*'|'+'|'?'|FROMTIL)?
        | ( '^'? '!'? ('F'|'C'|'L'|'P'|'CA'|'N'|'PE'|'G'|'CD'|'T'|'M'|'D')'=' NAME ('*'|'+'|'?'|FROMTIL)? '$'? );

MS : 'MS' [0-9];

SECTIONS: 'SEC' '=' ([0-9]+','?)+;

FROMTIL: '{'NUM'-'NUM'}';

NUM: [0-9]+;

NAME: CHAR+ | ',' | '.' | '*';

CHAR: [a-zA-Z0-9_äöüßÄÖÜ\-];

MACRONAME: '#'[a-zA-Z_][a-zA-Z_0-9]*;

MACROFREE: [a-zA-Z!]+;

COMMENT: '//' ~('\r'|'\n')*;

complexpattern/pattern/element/block 解析器规则应该接受一个简单的“*”，我不明白为什么他们不接受。

Answer 1

在您的 macro 规则中，您定义了文字 '*'，导致 ID 规则 not 匹配单个 "*"作为输入。

标识符 Lexer 规则与它应该匹配的“*”不匹配

Identifier Lexer rule does not match '*' like its supposed to

antlr4