将 13+ 百万个小文件复制到新服务器

Copy 13+ Million Tiny Files to New Server

情况:

用较新的 Windows 2003 共享 FC 存储的 Windows 2000 共享 MSA SCSI 存储的 2 节点群集替换一个 10 年以上的旧 Windows 2 节点群集。

共享存储当前分为两个驱动器 X(数据)和 Q(仲裁)。

X Drive 由一个平面文件数据库组成,该数据库由 130 万多个文件夹中的 1310 万多个文件组成。这些文件需要以最短的停机时间从旧集群复制到新集群。

旧的 Win 200 集群已经运行了 10 多年,一直 reading/writing 现在也严重分散。 Win 2000 集群上的 X 驱动器还包含 7 个 backups 数据库,每天通过 Robo Copy created/updated 一次,这目前需要 4-5 小时并且对系统性能增加了真正的滞后.

旧集群 - 2 台惠普 DL380 G4 | 1 x HP MSA 500 G2 (SCSI) |突袭 5(4 个磁盘 + 备用)|赢 2k

新建集群 - 2 台惠普 DL380 G7 | 1 x HP StorageWorks P2000 G2 MSA(光纤通道)|赢 2k3

数据库可以轻松离线 5 到 8 小时,绝对最大值为 15 小时,因为它提供的时间敏感数据。

我们尝试过的选项:

  1. Robo / FastCopy 似乎都在每秒复制 100-300 个文件,数据库处于离线状态。
  2. Peersync 从本地节点备份(D: 驱动器)复制,这在 17 小时内完成,平均每秒 250 个文件。

Question/Options:

  1. 逐块复制 - 我们认为可能是最快的,但它也会从原始 X 驱动器复制备份ps。
  2. 重定向每日备份 - 将每日备份从本地 X 驱动器重定向到新 X 驱动器的网络共享。一开始很慢,但是当我们开始切换时最多只会过时 12 小时,因为在旧系统运行时可能会 运行。搬家当天的最终同步,应该不会超过 10 个小时,以 100% 确认新旧系统相同。
  3. 自定义复制脚本 - 我们可以访问 C# 和 Python
  4. Robo/Fast复制/其他文件复制,接受建议和设置
  5. Disk Replace / Raid Rebuild - 有风险或不可能的选择,将每个旧磁盘替换为新的更小尺寸的磁盘,在旧的 G2 caddy 中,允许 raid重建、更换和重建,直到更换所有驱动器。在迁移当天,以相同的 raid 顺序将 4 个磁盘移动到新的 P2000 MSA?
  6. 放弃 - 将它留在旧硬件上 运行ning 直到它死去。*

我们似乎被选项 2 所吸引,但我们认为我们应该在做出决定之前将其征求世界上一些最优秀的人才的意见。

ps。新集群上的 Backups 是使用 Shadow Copy 的新 (M) 驱动器。 * 不幸的是,这不是一个真正的选择,因为我们确实需要迁移到更新的硬件,因为旧的存储和集群无法再满足需求。

我们采用选项 2,并将每天两次的备份从原始集群重定向到新集群上的新 MSA raid。

它是 运行 作为使用 PeerSync 的新集群的拉动和旧集群上的 Windows 共享。

我们尝试使用 PeerSync TCP 客户端,它会更快/更高效,但它与 Windows 2000 不兼容。由于其兼容性,PeerSync 在大多数其他复制工具中被选中和非锁定文件操作,允许原始集群始终在线,对性能的影响最小。

初始副本大约需要 13.5 小时,增量差异副本大约需要 5.5 小时。主要限制因素是原始集群共享 MSA RaidSet,驱动器在线并通过备份访问,因此正常操作减慢了备份时间。

最后一次同步花费了大约 5 个小时,这是数据库离线的总时间,用于硬件升级。