解析一个 int(x) 参数
Parsing an int(x) parameter
这是一个带有一个 int
参数的简单函数:
void f(int x) {}
f(42);
这是另一个带有一个 int
参数的函数:
void g(int(x)) {}
g(42);
现在让我们将x
定义为一个类型:
typedef int x;
void h(int(x)) {}
h(42);
// warning: passing argument 1 of ‘h’ makes pointer from integer without a cast
(这是我用 gcc 4.8.2 观察到的行为)
解析器作者如何处理这种情况?
似乎经典管道 Lexer -> Parser -> Semantic Checker -> ... 在这里不起作用。
您有效地将 h
定义为:
void h(int(int)) {}
参数被解释为一个未命名的函数指针,它接受一个 int
和 returns 一个 int
。当您尝试将 42
传递给它时,编译器会抱怨您正试图从整数创建函数指针。
我认为您要问的是编译器如何处理(未命名的)函数指针类型及其可能含糊不清的解析。您的问题与 C++ 中的 the most vexing parse 有关。
在那里他们决定,只要函数指针类型和另一种解析方式之间存在歧义,就会将其解释为函数指针。他们这样做是因为当您不希望它成为函数指针时,还有其他方法可以消除歧义(例如 - 将其括在括号中,使用 {} 初始化语法等)。
详细了解解析器作者可能如何处理此解析,这里是 C11 的词法分析器和语法:http://quut.com/c/ANSI-C-grammar-l-2011.html 在您的示例中,在 typedef 之前,x
将是一个IDENTIFIER
标记,而之后,它将是一个 TYPEDEF_NAME
标记,因为分析器通过符号 table 被告知 x
现在是一种类型。在这种特殊情况下,解析是明确的。在这种情况下,您似乎指的 "pipeline feedback" 是通过符号 table 出现的,其中词法分析器通过更高级别了解上下文,随着编译的进行影响其输出。
EDIT: These three articles,由 OP 发现,描述了这个问题以及一些 C 解析器/编译器如何很好地解决它。基本上,几乎可以指定一个只接受/生成合法 C 语法的上下文无关语法(CFG)。通过引入允许词法分析器适当区分标识符和 typedef 名称的作用域查找 table,然后是一个 CFG [更重要的是一个 LALR(1) 解析器(例如 - 生成的 yacc)] / 生成可以指定的合法 C 语法。
这是一个比 OP 更可怕的例子:
typedef int x;
int main() { x x = 5; return x; } /* crazily enough this is legal C syntax and a well formed C program */
引入typedef后
typedef int x;
函数定义如下
void h(int( int ) ) {}
即它的参数被声明为函数类型 int( int )
调整为指向函数的指针。
您调用提供整数的函数:
h(42);
没有从整数到函数指针的隐式转换。
我没有发现
有问题
It seems the classic pipeline Lexer -> Parser -> Semantic Checker ->
... does not work here.
参数被 typedef 替代。
x 具有类型的编译器属性。所以它认为记录像
type-specifier h(type-specifier( type-name ) ) {}
这是一个带有一个 int
参数的简单函数:
void f(int x) {}
f(42);
这是另一个带有一个 int
参数的函数:
void g(int(x)) {}
g(42);
现在让我们将x
定义为一个类型:
typedef int x;
void h(int(x)) {}
h(42);
// warning: passing argument 1 of ‘h’ makes pointer from integer without a cast
(这是我用 gcc 4.8.2 观察到的行为)
解析器作者如何处理这种情况?
似乎经典管道 Lexer -> Parser -> Semantic Checker -> ... 在这里不起作用。
您有效地将 h
定义为:
void h(int(int)) {}
参数被解释为一个未命名的函数指针,它接受一个 int
和 returns 一个 int
。当您尝试将 42
传递给它时,编译器会抱怨您正试图从整数创建函数指针。
我认为您要问的是编译器如何处理(未命名的)函数指针类型及其可能含糊不清的解析。您的问题与 C++ 中的 the most vexing parse 有关。
在那里他们决定,只要函数指针类型和另一种解析方式之间存在歧义,就会将其解释为函数指针。他们这样做是因为当您不希望它成为函数指针时,还有其他方法可以消除歧义(例如 - 将其括在括号中,使用 {} 初始化语法等)。
详细了解解析器作者可能如何处理此解析,这里是 C11 的词法分析器和语法:http://quut.com/c/ANSI-C-grammar-l-2011.html 在您的示例中,在 typedef 之前,x
将是一个IDENTIFIER
标记,而之后,它将是一个 TYPEDEF_NAME
标记,因为分析器通过符号 table 被告知 x
现在是一种类型。在这种特殊情况下,解析是明确的。在这种情况下,您似乎指的 "pipeline feedback" 是通过符号 table 出现的,其中词法分析器通过更高级别了解上下文,随着编译的进行影响其输出。
EDIT: These three articles,由 OP 发现,描述了这个问题以及一些 C 解析器/编译器如何很好地解决它。基本上,几乎可以指定一个只接受/生成合法 C 语法的上下文无关语法(CFG)。通过引入允许词法分析器适当区分标识符和 typedef 名称的作用域查找 table,然后是一个 CFG [更重要的是一个 LALR(1) 解析器(例如 - 生成的 yacc)] / 生成可以指定的合法 C 语法。
这是一个比 OP 更可怕的例子:
typedef int x;
int main() { x x = 5; return x; } /* crazily enough this is legal C syntax and a well formed C program */
引入typedef后
typedef int x;
函数定义如下
void h(int( int ) ) {}
即它的参数被声明为函数类型 int( int )
调整为指向函数的指针。
您调用提供整数的函数:
h(42);
没有从整数到函数指针的隐式转换。
我没有发现
有问题It seems the classic pipeline Lexer -> Parser -> Semantic Checker -> ... does not work here.
参数被 typedef 替代。
x 具有类型的编译器属性。所以它认为记录像
type-specifier h(type-specifier( type-name ) ) {}