我怎么能在yacc中识别皮卡丘语言？

Question

我正在尝试做一个简单的lex&yacc程序，可以识别皮卡丘的三种声音：pi、pika和pikachu。我唯一的规则是一个标记不能连续出现 3 次。我试过这个：

%token PI PIKA PIKACHU

%%
program : program line '\n'
    |
    ;
line: PI piWords
    | PIKA pikaWords
    | PIKACHU pikachuWords
    ;
piWords: PI 
    | PI pikaWords
    | PI pikachuWords
    ;
pikaWords: PIKA 
    | PIKA piWords
    | PIKA pikachuWords
    ;
pikachuWords: PIKACHU
    | PIKACHU piWords
    | PIKACHU pikaWords
    ;
%%

但这并不适用于所有组合，例如 Pika Pikachu pikachu。我怎么能重写这个？还尝试限制 lex 中的标记，例如 {0,2} 但是当我写 pi pi pi 时它仍然有效，即使它不应该。
更新。
基于下面的想法，我确实设法完成了这个。我非常接近，我所需要的只是跟踪是否还有 2 次重复。我是这样做的：

program : program line '\n'
    |
    ;
line: piWords
    | pikaWords
    | pikachuWords
    ;
piWords: PI  
    | PI pikaWords
    | PI PI pikaWords
    | PI pikachuWords
    | PI PI pikachuWords
    ;
pikaWords: PIKA 
    | PIKA piWords
    | PIKA PIKA piWords
    | PIKA pikachuWords
    | PIKA PIKA pikachuWords
    ;
pikachuWords: PIKACHU
    | PIKACHU piWords
    | PIKACHU PIKACHU piWords
    | PIKACHU pikaWords
    | PIKACHU PIKACHU pikaWords
    ;

Answer 1

你这里的语法是正确的，但需要稍微调整一下。

直觉上，每个非终结符都会跟踪你看到的最后一个终结符，这样你就不会让同一个字符串连续出现两次。您可以通过让非终端跟踪以下信息来扩展这个想法：我看到的最后一个终端是什么，我看到了多少个副本？因此，例如，当最后一个终端是 PI 时，你会有两个非终结符，一个是当 PI 读取是第一个 PI 时，另一个是当 PI 读取是第二个 PI 时。根据目前已阅读的内容，思考产生式如何在这些不同的非终结符之间转换。

我怎么能在yacc中识别皮卡丘语言？

How could I recognise the Pikachu language in yacc?

parsing

yacc