Redshift JSON 性能

Redshift JSON Performance

Redshift 提供了一组 JSON 函数,允许执行 JSON 操作,但有没有人测试过 JSON 与普通 table 列相比的性能?我想使用 Redshift 的主要原因是它的柱状性质,因为我想对存储在 Redshift 中的分析数据执行复杂的聚合。

根据 Redshift 文档中的 JSON 函数页面,Redshift 似乎不会以 JSON 数据类型的柱状格式存储数据。 (link) 但是我知道一些基于 Redshift 的分析服务以 JSON 格式存储数据。有人在 Redshift 中对 JSON 格式进行了基准测试吗?即使失去了 Redshift 的主要优势,它真的值得使用吗?

一个数据点:

集群:24xdc1.large table:2.4B 行

select count(*) from table where json_extract_path_text(what_extra_json, 'is_logged_in') is not null
   count
------------
 1364239102

24.7秒

select count(*) from table where plan is not null
   count
------------
 1370337529

6.1秒