获取具有特定值的记录数量,但每个唯一字段仅获取一次
Get amount of records with specific value, but only once per unique field
我不是在寻找完整的答案,但也许可以找到一些关于我应该查看哪种 mysql 命令来解决这个问题的指示。
我有一系列传感器 (30+) 连接到我的网络。在不同的时间间隔,我请求它们的状态,每个设备都回复 n 个布尔值,其中 n 可以是 0 到 120 之间的任何值(因此响应可以是空对象、120 个布尔值列表或介于两者之间的任何数量).
根据收到的布尔值,我创建了一条新记录,以及设备的 mac 地址和时间戳。例如 (see also this sqlfiddle):
+----+-------------------+---------------------+--------+
| id | device_address | timestamp | status |
+----+-------------------+---------------------+--------+
| 1 | f2:49:d2:17:5d:8d | 2018-09-22 15:54:51 | 0 |
| 2 | fd:30:ec:08:67:9a | 2018-09-22 15:54:56 | 0 |
| 3 | f8:8d:d9:64:a4:7c | 2018-09-22 15:54:58 | 1 |
| 4 | f2:49:d2:17:5d:8d | 2018-09-22 15:55:51 | 0 |
| 5 | f2:49:d2:17:5d:8d | 2018-09-22 15:55:52 | 0 |
| 6 | fd:30:ec:08:67:9a | 2018-09-22 15:55:56 | 1 |
| 7 | f8:8d:d9:64:a4:7c | 2018-09-22 15:55:58 | 1 |
| 8 | f2:49:d2:17:5d:8d | 2018-09-22 15:56:52 | 0 |
| 9 | f2:49:d2:17:5d:8d | 2018-09-22 15:57:52 | 1 |
| 10 | f2:49:d2:17:5d:8d | 2018-09-22 15:58:52 | 1 |
+----+-------------------+---------------------+--------+
或者,替换 mac 地址以提高可读性:
+----+-------------------+---------------------+--------+
| id | device_address | timestamp | status |
+----+-------------------+---------------------+--------+
| 1 | A | 2018-09-22 15:54:51 | 0 |
| 2 | BB | 2018-09-22 15:54:56 | 0 |
| 3 | CCC | 2018-09-22 15:54:58 | 1 |
| 4 | A | 2018-09-22 15:55:51 | 0 |
| 5 | A | 2018-09-22 15:55:52 | 0 |
| 6 | BB | 2018-09-22 15:55:56 | 1 |
| 7 | CCC | 2018-09-22 15:55:58 | 1 |
| 8 | A | 2018-09-22 15:56:52 | 0 |
| 9 | A | 2018-09-22 15:57:52 | 1 |
| 10 | A | 2018-09-22 15:58:52 | 1 |
+----+-------------------+---------------------+--------+
最后,我希望能够绘制这些值的图表,按时间间隔分组。例如,当我绘制最近 2 小时的数据时,我想使用 5 分钟的时间间隔。每个时间间隔我想知道有多少(唯一)设备在那个时期至少有一次状态为 1,有多少只有零。根本没有出现在时间块内的设备(因为它们没有 return 布尔值)与该时间块无关
以上记录将落在两个这样的 5 分钟时间段内:
- 15:50:00 到 15:54:59 - ids 1 2 3
- 15:55:00 到 15:59:59 - ids 4 5 6 7 8 9 10
我想要的回复是这样的:
+---------------------+---------------------------------+-------------------------+
| timeblock start | dev w/ at least one status of 1 | dev w/ only status of 0 |
+---------------------+---------------------------------+-------------------------+
| 2018-09-22 15:50:00 | 1 | 2 |
| 2018-09-22 15:55:00 | 2 | 1 |
+---------------------+---------------------------------+-------------------------+
最终结果不必完全是这样,其他可以帮助我推导出这些数字的结果也可以。时间戳字段也是如此;这种 2018-09-22 15:50:00
格式会很棒,但其他格式也可以让我扣除时间段。
做这样的事情让我得到不同的时间块和每个时间块内唯一设备的数量,但它计算的是 1 和 0 的总数,而不是合并每个唯一设备的结果。
SELECT timestamp,
SUM(status) as ones, COUNT(status)-SUM(status) as zeroes,
COUNT(DISTINCT(device_address)) as unique_devices
FROM records
GROUP BY UNIX_TIMESTAMP(timestamp) DIV 300
ORDER BY timestamp ASC
结果:
+----------------------+------+--------+----------------+
| timestamp | ones | zeroes | unique devices |
+----------------------+------+--------+----------------+
| 2018-09-22T15:54:51Z | 1 | 2 | 3 |
| 2018-09-22T15:57:52Z | 4 | 3 | 3 |
+----------------------+------+--------+----------------+
使用条件聚合
SELECT timestamp,
count(distinct case when status = 1 then device_address end) as ones,
count(distinct case when status = 0 then device_address end) as zeros,
FROM records
GROUP BY UNIX_TIMESTAMP(timestamp) DIV 300
ORDER BY timestamp ASC
我不是在寻找完整的答案,但也许可以找到一些关于我应该查看哪种 mysql 命令来解决这个问题的指示。
我有一系列传感器 (30+) 连接到我的网络。在不同的时间间隔,我请求它们的状态,每个设备都回复 n 个布尔值,其中 n 可以是 0 到 120 之间的任何值(因此响应可以是空对象、120 个布尔值列表或介于两者之间的任何数量).
根据收到的布尔值,我创建了一条新记录,以及设备的 mac 地址和时间戳。例如 (see also this sqlfiddle):
+----+-------------------+---------------------+--------+
| id | device_address | timestamp | status |
+----+-------------------+---------------------+--------+
| 1 | f2:49:d2:17:5d:8d | 2018-09-22 15:54:51 | 0 |
| 2 | fd:30:ec:08:67:9a | 2018-09-22 15:54:56 | 0 |
| 3 | f8:8d:d9:64:a4:7c | 2018-09-22 15:54:58 | 1 |
| 4 | f2:49:d2:17:5d:8d | 2018-09-22 15:55:51 | 0 |
| 5 | f2:49:d2:17:5d:8d | 2018-09-22 15:55:52 | 0 |
| 6 | fd:30:ec:08:67:9a | 2018-09-22 15:55:56 | 1 |
| 7 | f8:8d:d9:64:a4:7c | 2018-09-22 15:55:58 | 1 |
| 8 | f2:49:d2:17:5d:8d | 2018-09-22 15:56:52 | 0 |
| 9 | f2:49:d2:17:5d:8d | 2018-09-22 15:57:52 | 1 |
| 10 | f2:49:d2:17:5d:8d | 2018-09-22 15:58:52 | 1 |
+----+-------------------+---------------------+--------+
或者,替换 mac 地址以提高可读性:
+----+-------------------+---------------------+--------+
| id | device_address | timestamp | status |
+----+-------------------+---------------------+--------+
| 1 | A | 2018-09-22 15:54:51 | 0 |
| 2 | BB | 2018-09-22 15:54:56 | 0 |
| 3 | CCC | 2018-09-22 15:54:58 | 1 |
| 4 | A | 2018-09-22 15:55:51 | 0 |
| 5 | A | 2018-09-22 15:55:52 | 0 |
| 6 | BB | 2018-09-22 15:55:56 | 1 |
| 7 | CCC | 2018-09-22 15:55:58 | 1 |
| 8 | A | 2018-09-22 15:56:52 | 0 |
| 9 | A | 2018-09-22 15:57:52 | 1 |
| 10 | A | 2018-09-22 15:58:52 | 1 |
+----+-------------------+---------------------+--------+
最后,我希望能够绘制这些值的图表,按时间间隔分组。例如,当我绘制最近 2 小时的数据时,我想使用 5 分钟的时间间隔。每个时间间隔我想知道有多少(唯一)设备在那个时期至少有一次状态为 1,有多少只有零。根本没有出现在时间块内的设备(因为它们没有 return 布尔值)与该时间块无关
以上记录将落在两个这样的 5 分钟时间段内:
- 15:50:00 到 15:54:59 - ids 1 2 3
- 15:55:00 到 15:59:59 - ids 4 5 6 7 8 9 10
我想要的回复是这样的:
+---------------------+---------------------------------+-------------------------+
| timeblock start | dev w/ at least one status of 1 | dev w/ only status of 0 |
+---------------------+---------------------------------+-------------------------+
| 2018-09-22 15:50:00 | 1 | 2 |
| 2018-09-22 15:55:00 | 2 | 1 |
+---------------------+---------------------------------+-------------------------+
最终结果不必完全是这样,其他可以帮助我推导出这些数字的结果也可以。时间戳字段也是如此;这种 2018-09-22 15:50:00
格式会很棒,但其他格式也可以让我扣除时间段。
做这样的事情让我得到不同的时间块和每个时间块内唯一设备的数量,但它计算的是 1 和 0 的总数,而不是合并每个唯一设备的结果。
SELECT timestamp,
SUM(status) as ones, COUNT(status)-SUM(status) as zeroes,
COUNT(DISTINCT(device_address)) as unique_devices
FROM records
GROUP BY UNIX_TIMESTAMP(timestamp) DIV 300
ORDER BY timestamp ASC
结果:
+----------------------+------+--------+----------------+
| timestamp | ones | zeroes | unique devices |
+----------------------+------+--------+----------------+
| 2018-09-22T15:54:51Z | 1 | 2 | 3 |
| 2018-09-22T15:57:52Z | 4 | 3 | 3 |
+----------------------+------+--------+----------------+
使用条件聚合
SELECT timestamp,
count(distinct case when status = 1 then device_address end) as ones,
count(distinct case when status = 0 then device_address end) as zeros,
FROM records
GROUP BY UNIX_TIMESTAMP(timestamp) DIV 300
ORDER BY timestamp ASC