Linux 触发数据更新和转换的工具(低端ETL/data 仓储工具)

Linux tool for triggering data updates and transformations (low-end ETL/data warehousing tool)

我有一堆脚本从互联网和本地服务收集数据,将它们写入磁盘,转换数据并将其写入数据库的脚本,从数据库读取数据并生成新数据的脚本等,写在bash, Python, SQL, ... (Linux).

除了一些时间触发的脚本,脚本之间的粘合剂目前是我,运行脚本不时以特定的顺序更新所有内容。

用一个观察依赖关系,只要满足前提条件就触发下一步的工具来代替我最简单的方法是什么?

我找到了很多 ETL 和数据仓库工具,但这些对于我的简单设置来说似乎太重了。我更喜欢具有基于文本的配置的 CLI 解决方案(也许能够可视化依赖关系图)。有什么建议吗?

尝试气流:airflow.apache.org