找到athena查询结果的来源

Find the source of athena query result

我们在 S3 中存储了数千个文件。这些文件暴露给雅典娜,以便我们可以查询它们。在进行调试时,我发现 athena 在查询特定 id 时显示多个空行。鉴于有数千个文件,我不确定这些数据来自哪里。

有什么方法可以让我看到雅典娜结果中各行的源文件?

Presto Hive 连接器公开了一个隐藏列:"$path" 此列公开了已从中读取的特定行的文件路径。

注意:列名实际上是$path,但您需要在SQL中"引用它。这是因为 $ 在标识符中是非法的。