SnowFlake - 微分区扩展

SnowFlake - Micropartition Extension

我们了解到snowflake将数据存储在每16MB的MicroPartition中(这样理解对吗?)。微分区文件是否以 .FDN 文件扩展名存储? .FDN 是雪花专有的吗? .FDN 的扩展名是什么?

另外,当我只插入一条单独的记录时,snowflake 是否会为其创建一个新的微分区文件?

大约 16MB 的文件大小是正确的。您的最后一个问题是肯定的(因为存储在 blob 存储中的文件是不可变的)。不过,新文件可能是该记录加上来自另一个微分区的其他记录的合并。

而 FDN 的完整形式是 Flocon De Neige,在法语中是雪花。这是专有格式。补充一下 Mike 所说的,由于 SNOWFLAKE 是不可变的,并且每次插入都会创建一个新分区,因此不建议在 SNOWFLAKE 中一次插入一条记录,这是设计使然。插入一条记录与插入 100,000 条记录所花费的时间大致相同。因此,建议在 SNOWFLAKE.Understanding 中进行批量插入,分区对于优化查询也至关重要。