Azure Time Series Insights Gen2 的高存储成本
High Storage Cost with Azure Time Series Insights Gen2
我们目前 confused/concerned 时间序列见解实例的基础存储帐户的存储成本的发展。
Time Series Insights Ingress Received Bytes 显示过去 30 天的大小为 1.5 GB:
如果我查看同一时间跨度的相关存储帐户,我会看到 7.9 TB 的入口:
我知道 TSI 需要一些 space 用于附加索引等,但这种差异非常令人惊讶,并且会在我们扩展解决方案时导致问题。
我们将 Warm Storage Retention 设置为最长 31 天。
使用时间序列见解时是否会出现这种行为,或者我们可以采取什么措施来减少存储帐户的使用?我在文档中找不到有关此行为的任何信息。
- 由于每个分区的入口极少,TSI 通过覆盖部分文件对存储进行相对较大的写入。
- TSI 正在部署一项增强功能,可将事务和写入存储的数量减少多个数量级;特别是对于小入口率。
- 作为临时解决方法,对于较小的入口速率,建议使用分区数较少的集线器,例如目标是每个分区 0.2-0.5 MBps。
将来我更愿意为此类调查提出支持请求
我们认为根本原因是低推送率与 TSI 将数据附加到 parquet blob 的方式的混合。
有一种新算法可以解决此问题。
请打开支持票,然后我们可以修复它。
谢谢。
我们目前 confused/concerned 时间序列见解实例的基础存储帐户的存储成本的发展。
Time Series Insights Ingress Received Bytes 显示过去 30 天的大小为 1.5 GB:
如果我查看同一时间跨度的相关存储帐户,我会看到 7.9 TB 的入口:
我知道 TSI 需要一些 space 用于附加索引等,但这种差异非常令人惊讶,并且会在我们扩展解决方案时导致问题。
我们将 Warm Storage Retention 设置为最长 31 天。
使用时间序列见解时是否会出现这种行为,或者我们可以采取什么措施来减少存储帐户的使用?我在文档中找不到有关此行为的任何信息。
- 由于每个分区的入口极少,TSI 通过覆盖部分文件对存储进行相对较大的写入。
- TSI 正在部署一项增强功能,可将事务和写入存储的数量减少多个数量级;特别是对于小入口率。
- 作为临时解决方法,对于较小的入口速率,建议使用分区数较少的集线器,例如目标是每个分区 0.2-0.5 MBps。
将来我更愿意为此类调查提出支持请求
我们认为根本原因是低推送率与 TSI 将数据附加到 parquet blob 的方式的混合。 有一种新算法可以解决此问题。
请打开支持票,然后我们可以修复它。
谢谢。