/var/lib/etcd/member/snap 中的 etcd 文件
etcd files in /var/lib/etcd/member/snap
我们的 kubernetes 集群最近因为 etcd 崩溃了 "database size exceeded"。
我们通过 "simple" etcd 集群端点碎片整理 (see here) 成功地恢复了一切。
不幸的是,一切还不完美。
特别是 etcd 端点的 /var/lib/etcd/member/snap 目录:
total 25G
-rw-r--r--. 1 etcd root 21K Jun 29 20:27 00000000000810cb-00000000066072bc.snap
-rw-r--r--. 1 etcd root 21K Jun 29 20:40 00000000000810cb-00000000066099cd.snap
-rw-r--r--. 1 etcd root 21K Jun 29 20:55 00000000000810df-000000000660c0de.snap
-rw-r--r--. 1 etcd root 21K Jun 29 21:19 000000000008113f-000000000660e7ef.snap
-rw-r--r--. 1 etcd root 21K Jun 29 21:37 0000000000081162-0000000006610f00.snap
-rw-------. 1 etcd root 916M Jun 29 15:40 000000000619e354.snap.db
-rw-------. 1 etcd root 916M Jun 29 15:41 00000000061b9704.snap.db
-rw-------. 1 etcd root 916M Jun 29 15:43 00000000061ca269.snap.db
-rw-------. 1 etcd root 916M Jun 29 15:44 00000000061dbb43.snap.db
-rw-------. 1 etcd root 916M Jun 29 15:47 00000000061e40df.snap.db
-rw-------. 1 etcd root 916M Jun 29 15:48 00000000061e8192.snap.db
-rw-------. 1 etcd root 916M Jun 29 15:49 00000000061f8799.snap.db
-rw-------. 1 etcd root 916M Jun 29 15:49 0000000006200018.snap.db
-rw-------. 1 etcd root 916M Jun 29 15:52 0000000006225cfd.snap.db
-rw-------. 1 etcd root 916M Jun 29 15:53 00000000062323d6.snap.db
-rw-------. 1 etcd root 916M Jun 29 15:53 00000000062396fa.snap.db
-rw-------. 1 etcd root 970M Jun 29 15:54 000000000624dfe7.snap.db
-rw-------. 1 etcd root 1003M Jun 29 15:54 0000000006259f3f.snap.db
-rw-------. 1 etcd root 1.2G Jun 29 15:58 0000000006296ff0.snap.db
-rw-------. 1 etcd root 1.2G Jun 29 15:59 000000000629b9bc.snap.db
-rw-------. 1 etcd root 1.2G Jun 29 16:01 00000000062b02c0.snap.db
-rw-------. 1 etcd root 1.2G Jun 29 16:02 00000000062bef04.snap.db
-rw-------. 1 etcd root 1.2G Jun 29 16:05 00000000062db8e2.snap.db
-rw-------. 1 etcd root 1.2G Jun 29 16:09 00000000062ef4c4.snap.db
-rw-------. 1 etcd root 1.2G Jun 29 16:11 00000000062fce7a.snap.db
-rw-------. 1 etcd root 1.2G Jun 29 16:12 00000000063063c1.snap.db
-rw-------. 1 etcd root 1.2G Jun 29 16:12 000000000630b648.snap.db
-rw-------. 1 etcd root 1.2G Jun 29 16:12 000000000630bdbb.snap.db
-rw-------. 1 etcd root 1.2G Jun 29 16:13 000000000630e3f1.snap.db
-rw-------. 1 etcd root 27M Jun 29 21:41 db
这是唯一一个这样的端点,在这个端点上我们是低磁盘。
没有关于这些文件的文档,尤其是在我们的案例中如何减少整体磁盘占用空间(已尝试碎片整理/压缩/等)。
那些文件是什么?
如何减少此端点的磁盘占用空间(摆脱那些巨大的 snap.db 文件)?
它们似乎 snapshots
随着时间的推移您的 etcd 集群的给定状态。
听起来它们可以旋转。至少按照这个:
etcdserver: purge old snap.db files #7967
https://github.com/coreos/etcd/pull/7967
希望这个回答对您有所帮助。
我们的 kubernetes 集群最近因为 etcd 崩溃了 "database size exceeded"。
我们通过 "simple" etcd 集群端点碎片整理 (see here) 成功地恢复了一切。
不幸的是,一切还不完美。 特别是 etcd 端点的 /var/lib/etcd/member/snap 目录:
total 25G
-rw-r--r--. 1 etcd root 21K Jun 29 20:27 00000000000810cb-00000000066072bc.snap
-rw-r--r--. 1 etcd root 21K Jun 29 20:40 00000000000810cb-00000000066099cd.snap
-rw-r--r--. 1 etcd root 21K Jun 29 20:55 00000000000810df-000000000660c0de.snap
-rw-r--r--. 1 etcd root 21K Jun 29 21:19 000000000008113f-000000000660e7ef.snap
-rw-r--r--. 1 etcd root 21K Jun 29 21:37 0000000000081162-0000000006610f00.snap
-rw-------. 1 etcd root 916M Jun 29 15:40 000000000619e354.snap.db
-rw-------. 1 etcd root 916M Jun 29 15:41 00000000061b9704.snap.db
-rw-------. 1 etcd root 916M Jun 29 15:43 00000000061ca269.snap.db
-rw-------. 1 etcd root 916M Jun 29 15:44 00000000061dbb43.snap.db
-rw-------. 1 etcd root 916M Jun 29 15:47 00000000061e40df.snap.db
-rw-------. 1 etcd root 916M Jun 29 15:48 00000000061e8192.snap.db
-rw-------. 1 etcd root 916M Jun 29 15:49 00000000061f8799.snap.db
-rw-------. 1 etcd root 916M Jun 29 15:49 0000000006200018.snap.db
-rw-------. 1 etcd root 916M Jun 29 15:52 0000000006225cfd.snap.db
-rw-------. 1 etcd root 916M Jun 29 15:53 00000000062323d6.snap.db
-rw-------. 1 etcd root 916M Jun 29 15:53 00000000062396fa.snap.db
-rw-------. 1 etcd root 970M Jun 29 15:54 000000000624dfe7.snap.db
-rw-------. 1 etcd root 1003M Jun 29 15:54 0000000006259f3f.snap.db
-rw-------. 1 etcd root 1.2G Jun 29 15:58 0000000006296ff0.snap.db
-rw-------. 1 etcd root 1.2G Jun 29 15:59 000000000629b9bc.snap.db
-rw-------. 1 etcd root 1.2G Jun 29 16:01 00000000062b02c0.snap.db
-rw-------. 1 etcd root 1.2G Jun 29 16:02 00000000062bef04.snap.db
-rw-------. 1 etcd root 1.2G Jun 29 16:05 00000000062db8e2.snap.db
-rw-------. 1 etcd root 1.2G Jun 29 16:09 00000000062ef4c4.snap.db
-rw-------. 1 etcd root 1.2G Jun 29 16:11 00000000062fce7a.snap.db
-rw-------. 1 etcd root 1.2G Jun 29 16:12 00000000063063c1.snap.db
-rw-------. 1 etcd root 1.2G Jun 29 16:12 000000000630b648.snap.db
-rw-------. 1 etcd root 1.2G Jun 29 16:12 000000000630bdbb.snap.db
-rw-------. 1 etcd root 1.2G Jun 29 16:13 000000000630e3f1.snap.db
-rw-------. 1 etcd root 27M Jun 29 21:41 db
这是唯一一个这样的端点,在这个端点上我们是低磁盘。
没有关于这些文件的文档,尤其是在我们的案例中如何减少整体磁盘占用空间(已尝试碎片整理/压缩/等)。
那些文件是什么? 如何减少此端点的磁盘占用空间(摆脱那些巨大的 snap.db 文件)?
它们似乎 snapshots
随着时间的推移您的 etcd 集群的给定状态。
听起来它们可以旋转。至少按照这个:
etcdserver: purge old snap.db files #7967 https://github.com/coreos/etcd/pull/7967
希望这个回答对您有所帮助。