如何计算 google 云存储中过滤后的文件大小

How to calculate filtered file size in google cloud storage

我有一个文件夹层次结构 Bucket/folder/year/month/date/files.ext 例如 2021/12/31/abc.html 和 2022/1/1/file1.html 等。该文件夹包含数百万 html 文件和图像。我只想计算仅由 .html 扩展过滤的大小总和,年份将从 2019 年开始到 2022 年,每个月和日期。 现在我正在使用

gsutil du gs://Bucket/folder/*/*/*/*.html | wc -l

我找不到任何更好的解决方案,它花费的时间太长,导致与您的 Google 云 Shell 的连接丢失。第二件事是我想删除 2019/1/1/file1.html

中的所有 html 个文件

很遗憾,我认为您已经找到了正确的答案。 GCS 不提供任何可按文件类型快速计算总文件大小的索引。

Cloud Shell 将在几分钟不活动后或总计 24 小时后超时,因此如果您有数百万个文件并需要完成此操作,我建议启动一个小型 GCE 实例并 运行 来自那里的命令,或来自你自己机器的 运行 gsutil。