Kafka 日志目录中文件的总大小小于它们大小的总和

Total size of files in Kafka logs directory is less than the sum of their sizes

我正在测试 Kafka 生产者应用程序并注意到 Kafka 日志的磁盘使用情况有些奇怪。在查看某个分区的日志目录的总大小时,当应用程序正在写入 Kafka 时,我看到:

$ ls -l --block-size=kB kafka-logs/mytopic-0
total 52311kB
-rw-rw-r-- 1 app-data app-data 10486kB Oct 29 12:45 00000000000000000000.index
-rw-rw-r-- 1 app-data app-data 46505kB Oct 29 12:45 00000000000000000000.log
-rw-rw-r-- 1 app-data app-data 10486kB Oct 29 12:45 00000000000000000000.timeindex
-rw-rw-r-- 1 app-data app-data     1kB Oct 29 11:55 leader-epoch-checkpoint

然后我停止我的应用程序,几分钟后我重复上面的命令,得到这个:

$ ls -l --block-size=kB kafka-logs/mytopic-0
total 46519kB
-rw-rw-r-- 1 app-data app-data 10486kB Oct 29 12:45 00000000000000000000.index
-rw-rw-r-- 1 app-data app-data 46505kB Oct 29 12:45 00000000000000000000.log
-rw-rw-r-- 1 app-data app-data 10486kB Oct 29 12:45 00000000000000000000.timeindex
-rw-rw-r-- 1 app-data app-data     1kB Oct 29 11:55 leader-epoch-checkpoint

问题:为什么ls总数字不是该目录下所有文件大小的总和?为什么在停止生产者应用程序后几分钟总数会减少,即使目录中的所有文件都保持相同大小?

文件可能有漏洞。你可以 运行 以下命令 :

du --apparent-size *