Redshift 磁盘 space 与节点数
Redshift disk space vs number of nodes
我目前正在使用 AWS Redshift 服务来存储数据。数据大小即将达到磁盘的 100% space。
添加节点和从单节点更改为多节点会增加磁盘大小吗?
从 dc1.xlarge 移动到更大的节点(例如 dc1.8xlarge)是增加磁盘的唯一方法吗 space?
如果我移动到多节点,数据会被拆分还是只是镜像以便两个节点将具有相同的数据?
Redshift 是一种分布式列式数据仓库解决方案。这里的关键是"distributed"。与传统数据库不同,Redshift 旨在通过向集群添加节点来进行横向扩展。添加节点会增加磁盘 space 以及计算能力。回答您的问题:
添加节点和从单节点更改为多节点是否会增加磁盘大小?
一般来说,是的。在 Redshift 中存储数据时,您应该选择一个分布键(列或列集),它将在不同节点之间均匀分布数据。作为一般原则,您应该在所有表中使用相同的一组列作为分布键。请注意,配置为使用 all 分布样式的表将在所有节点之间进行复制;将 dist 样式全部限制为维度表。
是否从 dc1.xlarge 迁移到更大的节点(例如 dc1.8xlarge)是增加磁盘的唯一方法 space?
没有;参见上面问题 1 的答案。您可以根据需要选择不同类型的节点。 DC1 是计算优化节点;他们有更小但更快的 SSD 驱动器。 DS1 节点将为您提供更高的磁盘 space 每个节点。
如果我移动到多节点,数据会被拆分还是只是镜像以便两个节点将具有相同的数据?
请参阅上面对问题 1 的回答 - 当您将节点添加到 Redshift 集群时,Redshift 将按照每个表的分配方式中指定的方式在所有节点上重新分配您的数据。
PS:我强烈建议您通读 Redshift 文档。从 Are You a First-Time Amazon Redshift User?
开始
我目前正在使用 AWS Redshift 服务来存储数据。数据大小即将达到磁盘的 100% space。
添加节点和从单节点更改为多节点会增加磁盘大小吗?
从 dc1.xlarge 移动到更大的节点(例如 dc1.8xlarge)是增加磁盘的唯一方法吗 space?
如果我移动到多节点,数据会被拆分还是只是镜像以便两个节点将具有相同的数据?
Redshift 是一种分布式列式数据仓库解决方案。这里的关键是"distributed"。与传统数据库不同,Redshift 旨在通过向集群添加节点来进行横向扩展。添加节点会增加磁盘 space 以及计算能力。回答您的问题:
添加节点和从单节点更改为多节点是否会增加磁盘大小?
一般来说,是的。在 Redshift 中存储数据时,您应该选择一个分布键(列或列集),它将在不同节点之间均匀分布数据。作为一般原则,您应该在所有表中使用相同的一组列作为分布键。请注意,配置为使用 all 分布样式的表将在所有节点之间进行复制;将 dist 样式全部限制为维度表。
是否从 dc1.xlarge 迁移到更大的节点(例如 dc1.8xlarge)是增加磁盘的唯一方法 space?
没有;参见上面问题 1 的答案。您可以根据需要选择不同类型的节点。 DC1 是计算优化节点;他们有更小但更快的 SSD 驱动器。 DS1 节点将为您提供更高的磁盘 space 每个节点。
如果我移动到多节点,数据会被拆分还是只是镜像以便两个节点将具有相同的数据?
请参阅上面对问题 1 的回答 - 当您将节点添加到 Redshift 集群时,Redshift 将按照每个表的分配方式中指定的方式在所有节点上重新分配您的数据。
PS:我强烈建议您通读 Redshift 文档。从 Are You a First-Time Amazon Redshift User?
开始