如何从 tree-sitter 中的节点获取值?
How to get the values from nodes in tree-sitter?
如果我在 tree-sitter 中有一个简单的语法:
rules: {
expr: $ => choice(
/[0-9]+/,
prec.right(seq($.expr, /[+-]/, $.expr)),
)
}
输入:
3+4
我得到以下 CST:
(start [0, 0] - [0, 3]
(expr [0, 0] - [0, 3]
(expr [0, 0] - [0, 1])
(expr [0, 2] - [0, 3])))
所以我的问题是,如何从这些 nodes/leafes 中获取值,即解析的内容。我不知何故必须评估这棵树。我肯定有办法,因为我也可以用 tree-sitter 进行语法高亮显示,以满足我需要的值(我猜)。但是我阅读了文档,找不到任何说明,如何做。
Tree-sitter 的语法树不存储输入文本的副本。因此,要获取特定标记的文本,您必须使用 Tree-sitter 提供的范围来计算原始源代码的 切片 。
在 python binding 中,它看起来像这样:
source_code_bytes = b'3 + 4'
tree = parser.parse(source_code_bytes)
node1 = tree.root_node.children[0].children[0]
node1_text = source_code_bytes[node1.start_byte:node1.end_byte].decode('utf8')
assert node1_text == '3'
在某些语言绑定中,例如 the wasm binding,有一个 .text
帮助程序可以使这更容易。
有 an open issue 用于将这种辅助函数添加到 python 绑定。
如果我在 tree-sitter 中有一个简单的语法:
rules: {
expr: $ => choice(
/[0-9]+/,
prec.right(seq($.expr, /[+-]/, $.expr)),
)
}
输入:
3+4
我得到以下 CST:
(start [0, 0] - [0, 3]
(expr [0, 0] - [0, 3]
(expr [0, 0] - [0, 1])
(expr [0, 2] - [0, 3])))
所以我的问题是,如何从这些 nodes/leafes 中获取值,即解析的内容。我不知何故必须评估这棵树。我肯定有办法,因为我也可以用 tree-sitter 进行语法高亮显示,以满足我需要的值(我猜)。但是我阅读了文档,找不到任何说明,如何做。
Tree-sitter 的语法树不存储输入文本的副本。因此,要获取特定标记的文本,您必须使用 Tree-sitter 提供的范围来计算原始源代码的 切片 。
在 python binding 中,它看起来像这样:
source_code_bytes = b'3 + 4'
tree = parser.parse(source_code_bytes)
node1 = tree.root_node.children[0].children[0]
node1_text = source_code_bytes[node1.start_byte:node1.end_byte].decode('utf8')
assert node1_text == '3'
在某些语言绑定中,例如 the wasm binding,有一个 .text
帮助程序可以使这更容易。
有 an open issue 用于将这种辅助函数添加到 python 绑定。