GCS中如何使用trino获取前缀路径
How to use trino to get prefix path in GCS
我使用带有 Hive+GCS 连接器的 Trino 来访问我在 GCS 中的 JSON 文件。如果我将外部 table 指向带有 JSON 的路径,它会起作用,例如:
create table transactions(
date DATE,
transaction1 DOUBLE,
TransactionType VARCHAR(255)
) WITH (
external_location = 'gs://bucket/transaction_type/date',
format = 'PARQUET'
);
但我只想传递到 transaction_type,它会递归地访问我在日期“文件夹”中的文件。
我知道 GCS 以不同于文件夹的方式处理存储桶内的所有内容,我相信这就是问题所在,但我不知道如何解决这个问题。
有没有人做过类似的事情?
您应该将 hive.recursive-directories 作为目录文件中的参数传递 hive.properties
我使用带有 Hive+GCS 连接器的 Trino 来访问我在 GCS 中的 JSON 文件。如果我将外部 table 指向带有 JSON 的路径,它会起作用,例如:
create table transactions(
date DATE,
transaction1 DOUBLE,
TransactionType VARCHAR(255)
) WITH (
external_location = 'gs://bucket/transaction_type/date',
format = 'PARQUET'
);
但我只想传递到 transaction_type,它会递归地访问我在日期“文件夹”中的文件。 我知道 GCS 以不同于文件夹的方式处理存储桶内的所有内容,我相信这就是问题所在,但我不知道如何解决这个问题。
有没有人做过类似的事情?
您应该将 hive.recursive-directories 作为目录文件中的参数传递 hive.properties