Clickhouse 未将新数据插入物化视图

Clickhouse is not inserting new data into Materialized view

我已经使用这个查询创建了一个物化视图

CREATE MATERIALIZED VIEW db.top_ids_mv (
`date_time` DateTime,
`id` String,
`total` UInt64
) ENGINE = SummingMergeTree
  ORDER BY
  (date_time, id) SETTINGS index_granularity = 8192 POPULATE AS
SELECT
  toDateTime((intDiv(toUInt32(date_time), 60 * 60) * 60) * 60) AS date_time,
  id AS id,
  count(*) AS count
FROM
  db.table
WHERE
  type = 'user'
GROUP BY
  date_time,id

我的 table 包含将近 180 亿条记录。我使用 POPULATE 插入了我的旧数据。但是新插入的数据并没有被插入到这个物化视图中。我创建了许多其他视图,它们工作正常,但这会产生问题。

这是我在日志中收到的内容

2021.09.23 19:54:54.424457 [ 137949 ] {5b0f3c32-2900-4ce4-996d-b9696bd38568} <Trace> PushingToViewsBlockOutputStream: Pushing (sequentially) from db.table (15229c91-c202-4809-9522-9c91c2028809) to db.top_ids_mv (0cedb783-bf17-42eb-8ced-b783bf1742eb) took 0 ms.

我注意到一件事是它花费了 0 毫秒。我认为这是错误的,因为查询必须花费一些时间。

谢谢。任何帮助将不胜感激

  1. SummingMergeTree 不存储指标 == 0 的行。
  2. total UInt64 <----> count(*) AS count -- 名称不匹配。您的 Mat.View 将 0 插入 totalcount 无处可去。

两者都是预期的,并且出于原因而具体实施。

https://den-crane.github.io/Everything_you_should_know_about_materialized_views_commented.pdf

...
SELECT
  toDateTime((intDiv(toUInt32(date_time), 60 * 60) * 60) * 60) AS date_time,
  id AS id,
  count(*) AS total       --<<<<<------
FROM
  db.table
...

为了查询性能和更好的数据压缩,我会这样做

ENGINE = SummingMergeTree
  ORDER BY   ( id, date_time ) --- order id , time 

也试试编解码器

`date_time` DateTime CODEC(Delta, LZ4),
`id` LowCardinality(String),
`total` UInt64 CODEC(T64, LZ4)