如何从缺少字段的 Influx 数据库中查询?

How to query from an Influx database with an absent field?

我有一个通过 telegraf 收集的测量值。它具有以下结构:

姓名:smart_device

fieldKey    fieldType
--------    ---------
exit_status integer
health_ok   boolean
read_error_rate integer
seek_error_rate integer
temp_c      integer
udma_crc_errors integer

当我查询这个数据库时,我可以这样做:

> select  * from smart_device where  "health_ok" = true limit 1
name: smart_device
time            capacity    device  enabled exit_status health_ok   host    model           read_error_rate seek_error_rate serial_no   temp_c  udma_crc_errors wwn
----            --------    ------  ------- ----------- ---------   ----    -----           --------------- --------------- ---------   ------  --------------- ---
15337409500 2000398934016   sda Enabled     0           true        osd21   Hitachi HDS722020ALA330    0        0       JK11A4B8JR2EGW  38  0       5000cca222e6384f

还有这个:

> select  * from smart_device limit 1
name: smart_device
time            capacity    device  enabled exit_status health_ok   host    model   read_error_rate seek_error_rate serial_no   temp_c  udma_crc_errors wwn
----            --------    ------  ------- ----------- ---------   ----    -----   --------------- --------------- ---------   ------  --------------- ---
1533046990                   sda            0                      osd21    

但是当我尝试过滤掉 health_ok 为空的记录时,我得到空输出:

> select  * from smart_device where "health_ok"!= true 
> 

我如何 select 测量空(没有?空?)health_ok

遗憾的是,目前无法使用 InfluxQL 执行此操作。 InfluxDB是一种面向文档的数据库;这意味着测量的行可以有不同的模式。因此,一行的某个字段没有null的概念;实际上这一行没有字段。例如假设测量 cost

中有 4 行
> select * from cost
name: cost
time                isok type value
----                ---- ---- -----
1533970927859614000 true 1    100
1533970938243629700 true 2    101
1533970949371761100      3    103
1533970961571703900      2    104

如您所见,有两行带有 isok=true 和两行没有名为 isok 的字段;因此只有一种方法可以通过此查询 select 具有 isok 字段的行的时间:

> select isok from cost
name: cost
time                isok
----                ----
1533970927859614000 true
1533970938243629700 true

由于InfluxQL目前不支持where子句中的子查询,因此无法查询没有isok字段的行(如果InfluxDB支持这种类型的查询,你可以这样查询SELECT * FROM cost WHERE time NOT IN (SELECT isok FROM cost))

这不是原问题的确切答案,但我发现了 Kapacitor 的一个特殊技巧。

如果这个查询已经被 kapacitor 执行,它 (kapacitor) 有一个特殊的节点 default 允许添加缺失的 fields/tags 一些值。

对于 health_ok 查询,它将如下所示 (tickscript):

var data = stream
    |from()
      .measurement('smart_device')
        |default()   
           .field('health_ok', FALSE)

这允许假设如果 health_ok 被遗漏,它是 FALSE