哪个数据库用于按天比较数据过程?
Which DB to use for comparing courses of data by days?
我目前正在考虑一个 "BigData" 小项目,我希望每 10 分钟记录一些使用情况,并在几个月或几年内将它们写入数据库。
然后我想分析数据,例如通过这些方式:
- 一天中的哪个时间最好(就低利用率而言)?
- 正常工作日和周末的利用率有何不同?
- 较高的利用率在正常星期一的什么时间开始?
为此,我显然需要建立平均图的可能性,例如到目前为止记录的所有星期一。
对于第一个 "proof of concept" 我设置了一个 InfluxDB 和 Grafana,它们可以很好地查看写入数据库的数据,但是我在互联网上研究得越多,我就越发现 InfluxDB 不是为我想做的事而做的(或者它还做不到)。
那么哪个数据库最适合记录和分析这样的数据?或者它更像是一个关于使用哪种工具来分析数据的问题?可能是哪个工具?
InfluxDB 查询语言对于您的问题不够灵活。
SQL Grafana 支持的数据库(MySQL、Postgres、TimescaleDB、Clickhouse)似乎适合 better.The 选择取决于您的偏好和数据量。对于较小的数据集,纯 MySQL 和 Postgres 可能就足够了。对于更高的负载,请考虑 TimescaleDB。对于数十亿个数据点,Clickhouse 可能更好。
如果您想要一个轻量级但可扩展的 NoSQL 时间序列解决方案,请查看 VictoriaMetrics。
我目前正在考虑一个 "BigData" 小项目,我希望每 10 分钟记录一些使用情况,并在几个月或几年内将它们写入数据库。 然后我想分析数据,例如通过这些方式:
- 一天中的哪个时间最好(就低利用率而言)?
- 正常工作日和周末的利用率有何不同?
- 较高的利用率在正常星期一的什么时间开始?
为此,我显然需要建立平均图的可能性,例如到目前为止记录的所有星期一。
对于第一个 "proof of concept" 我设置了一个 InfluxDB 和 Grafana,它们可以很好地查看写入数据库的数据,但是我在互联网上研究得越多,我就越发现 InfluxDB 不是为我想做的事而做的(或者它还做不到)。
那么哪个数据库最适合记录和分析这样的数据?或者它更像是一个关于使用哪种工具来分析数据的问题?可能是哪个工具?
InfluxDB 查询语言对于您的问题不够灵活。 SQL Grafana 支持的数据库(MySQL、Postgres、TimescaleDB、Clickhouse)似乎适合 better.The 选择取决于您的偏好和数据量。对于较小的数据集,纯 MySQL 和 Postgres 可能就足够了。对于更高的负载,请考虑 TimescaleDB。对于数十亿个数据点,Clickhouse 可能更好。
如果您想要一个轻量级但可扩展的 NoSQL 时间序列解决方案,请查看 VictoriaMetrics。