如何设置 Vora Table 分区大小?

How to set Vora Table partition size?

我已将 'partitionSize' 选项设置为多个不同的值,而且无论数量多少,我得到的分区数量似乎都相同。根据文档,应该对应于 HDFS 块大小。有没有我遗漏的东西。

HDFS 块大小 64M

创建 TABLE TABLE_TEST (DEFINITION_INFO) 使用 com.sap.spark.vora 选项 ( 表名 "TABLE_TEST", 分区大小 "64", 路径“/load_from_here/combined.csv”, 渴望加载 "true" )

csv约680M

参数名称有点误导。它不是用于分区表,而是在将数据加载到表时影响加载性能。在较新的版本中,它可能会被重命名以避免这种混淆。