如何加快从本地到内部阶段的 SnowSQL 文件导入
How to speed up SnowSQL file import from local to internal stage
我有大约 200 个 json 文件需要从本地导入到 4 个内部阶段(每个 50 个文件到 1 个内部阶段),每个文件大约 125 MB。
我是否可以通过 CMD 使用并行 snowsql 实例将这些文件并行发送到不同的阶段?另外,如果我增加仓库大小,速度会有什么不同吗? TIA
有几个因素需要考虑:
- SnowSQL 将为您压缩每个文件(如果尚未压缩),这会在执行
PUT
命令的计算机上占用 CPU。如果文件已经压缩,您需要将 AUTO-COMPRESS
参数指定为 FALSE
.
PUT
命令确实有一个可以使用的 PARALLEL
参数,但我通常建议这不超过您所在机器上可用的线程数 运行 PUT
命令来自.
- 您在 Snowflake 中的仓库大小不会影响
PUT
命令的速度。它根本不参与这个过程。
- 如果您有超过 1 台机器可以访问您的所有文件,您可以通过在多台机器上执行单独的
PUT
命令来提高并行度。在您的情况下,总共可能有 4 台机器是有意义的。但是,在某些时候,您会受到网络连接带宽量的限制。
我有大约 200 个 json 文件需要从本地导入到 4 个内部阶段(每个 50 个文件到 1 个内部阶段),每个文件大约 125 MB。
我是否可以通过 CMD 使用并行 snowsql 实例将这些文件并行发送到不同的阶段?另外,如果我增加仓库大小,速度会有什么不同吗? TIA
有几个因素需要考虑:
- SnowSQL 将为您压缩每个文件(如果尚未压缩),这会在执行
PUT
命令的计算机上占用 CPU。如果文件已经压缩,您需要将AUTO-COMPRESS
参数指定为FALSE
. PUT
命令确实有一个可以使用的PARALLEL
参数,但我通常建议这不超过您所在机器上可用的线程数 运行PUT
命令来自.- 您在 Snowflake 中的仓库大小不会影响
PUT
命令的速度。它根本不参与这个过程。 - 如果您有超过 1 台机器可以访问您的所有文件,您可以通过在多台机器上执行单独的
PUT
命令来提高并行度。在您的情况下,总共可能有 4 台机器是有意义的。但是,在某些时候,您会受到网络连接带宽量的限制。