Azure Time Series Insights Gen2 的高存储成本

High Storage Cost with Azure Time Series Insights Gen2

我们目前 confused/concerned 时间序列见解实例的基础存储帐户的存储成本的发展。

Time Series Insights Ingress Received Bytes 显示过去 30 天的大小为 1.5 GB:

如果我查看同一时间跨度的相关存储帐户,我会看到 7.9 TB 的入口:

我知道 TSI 需要一些 space 用于附加索引等,但这种差异非常令人惊讶,并且会在我们扩展解决方案时导致问题。

我们将 Warm Storage Retention 设置为最长 31 天。

使用时间序列见解时是否会出现这种行为,或者我们可以采取什么措施来减少存储帐户的使用?我在文档中找不到有关此行为的任何信息。

  • 由于每个分区的入口极少,TSI 通过覆盖部分文件对存储进行相对较大的写入。
  • TSI 正在部署一项增强功能,可将事务和写入存储的数量减少多个数量级;特别是对于小入口率。
  • 作为临时解决方法,对于较小的入口速率,建议使用分区数较少的集线器,例如目标是每个分区 0.2-0.5 MBps。

将来我更愿意为此类调查提出支持请求

我们认为根本原因是低推送率与 TSI 将数据附加到 parquet blob 的方式的混合。 有一种新算法可以解决此问题。

请打开支持票,然后我们可以修复它。

谢谢。