解析一个 int(x) 参数

Parsing an int(x) parameter

这是一个带有一个 int 参数的简单函数:

void f(int x) {}

f(42);

这是另一个带有一个 int 参数的函数:

void g(int(x)) {}

g(42);

现在让我们将x定义为一个类型:

typedef int x;
void h(int(x)) {}

h(42);
// warning: passing argument 1 of ‘h’ makes pointer from integer without a cast

(这是我用 gcc 4.8.2 观察到的行为)

解析器作者如何处理这种情况?

似乎经典管道 Lexer -> Parser -> Semantic Checker -> ... 在这里不起作用。

您有效地将 h 定义为:

void h(int(int)) {}

参数被解释为一个未命名的函数指针,它接受一个 int 和 returns 一个 int。当您尝试将 42 传递给它时,编译器会抱怨您正试图从整数创建函数指针。

我认为您要问的是编译器如何处理(未命名的)函数指针类型及其可能含糊不清的解析。您的问题与 C++ 中的 the most vexing parse 有关。

在那里他们决定,只要函数指针类型和另一种解析方式之间存在歧义,就会将其解释为函数指针。他们这样做是因为当您不希望它成为函数指针时,还有其他方法可以消除歧义(例如 - 将其括在括号中,使用 {} 初始化语法等)。

详细了解解析器作者可能如何处理此解析,这里是 C11 的词法分析器和语法:http://quut.com/c/ANSI-C-grammar-l-2011.html 在您的示例中,在 typedef 之前,x 将是一个IDENTIFIER 标记,而之后,它将是一个 TYPEDEF_NAME 标记,因为分析器通过符号 table 被告知 x 现在是一种类型。在这种特殊情况下,解析是明确的。在这种情况下,您似乎指的 "pipeline feedback" 是通过符号 table 出现的,其中词法分析器通过更高级别了解上下文,随着编译的进行影响其输出。

EDIT: These three articles,由 OP 发现,描述了这个问题以及一些 C 解析器/编译器如何很好地解决它。基本上,几乎可以指定一个只接受/生成合法 C 语法的上下文无关语法(CFG)。通过引入允许词法分析器适当区分标识符和 typedef 名称的作用域查找 table,然后是一个 CFG [更重要的是一个 LALR(1) 解析器(例如 - 生成的 yacc)] / 生成可以指定的合法 C 语法。

这是一个比 OP 更可怕的例子:

typedef int x;

int main() { x x = 5; return x; }  /* crazily enough this is legal C syntax and a well formed C program */

引入typedef后

typedef int x;

函数定义如下

void h(int( int ) ) {}

即它的参数被声明为函数类型 int( int ) 调整为指向函数的指针。

您调用提供整数的函数:

h(42);

没有从整数到函数指针的隐式转换。

我没有发现

有问题

It seems the classic pipeline Lexer -> Parser -> Semantic Checker -> ... does not work here.

参数被 typedef 替代。
x 具有类型的编译器属性。所以它认为记录像

type-specifier h(type-specifier( type-name ) ) {}