Apache Druid 的 RDBMS 摄取任务
RDBMS Ingestion task for Apache Druid
我开始使用 Apache Druid,想知道它是否能够从现有 RDBMS(Oracle 或 Postgres)中提取数据?
用例:
目前有多种数据来源:
- Kafka Streams(最终插入Relation DB的流式实时数据)
- Oracle/Postgres(最多 2 年的历史数据)
- CSV 文件(2 年以上的存档历史数据)
我希望使用 Apache Druid 来抽象确定要查询哪个数据源的复杂性。
Debezium 是您的解决方案,它可以流式传输来自 mysql postgres oracle 等的更改,您可以将其发送给 Apache druid,
因为您已经拥有 Kafka,所以它是您用例的最佳解决方案,
我开始使用 Apache Druid,想知道它是否能够从现有 RDBMS(Oracle 或 Postgres)中提取数据?
用例: 目前有多种数据来源:
- Kafka Streams(最终插入Relation DB的流式实时数据)
- Oracle/Postgres(最多 2 年的历史数据)
- CSV 文件(2 年以上的存档历史数据)
我希望使用 Apache Druid 来抽象确定要查询哪个数据源的复杂性。
Debezium 是您的解决方案,它可以流式传输来自 mysql postgres oracle 等的更改,您可以将其发送给 Apache druid,
因为您已经拥有 Kafka,所以它是您用例的最佳解决方案,