了解 Airflow 中的“None”调度预设
Understanding `None` scheduling preset in Airflow
我开始使用 Apache Airflow 并尝试在 Airflow 中设置一个事件驱动的 DAG。我的事件是一个文件被放置在 Linux 目录中。该文件可以在一天中多次登陆。我正在使用 File Sensor 运算符进行文件监控。
我的要求是每次文件登陆(具有相同名称)在 Dag 应该启动的目录中。
我正在阅读官方调度文档,根据我的理解,我看到选项 None 我可以让我的 Dag 根据事件在外部触发,并且它可以在一天内多次触发那个外部事件。
我的理解对吗?官方文档没有详细介绍。
https://airflow.apache.org/scheduler.html?highlight=scheduling
没错。将 schedule_interval 作为 None
意味着 Airflow 永远不会自动安排 Dag 的 运行。
您可以通过几种不同的方式在外部安排 dag_runs:
- 通过Airflow CLI
- 在 python 脚本中使用 Local client
- 通过Airflow REST API
- 通过 Web 中的触发按钮手动 UI
我开始使用 Apache Airflow 并尝试在 Airflow 中设置一个事件驱动的 DAG。我的事件是一个文件被放置在 Linux 目录中。该文件可以在一天中多次登陆。我正在使用 File Sensor 运算符进行文件监控。
我的要求是每次文件登陆(具有相同名称)在 Dag 应该启动的目录中。
我正在阅读官方调度文档,根据我的理解,我看到选项 None 我可以让我的 Dag 根据事件在外部触发,并且它可以在一天内多次触发那个外部事件。
我的理解对吗?官方文档没有详细介绍。
https://airflow.apache.org/scheduler.html?highlight=scheduling
没错。将 schedule_interval 作为 None
意味着 Airflow 永远不会自动安排 Dag 的 运行。
您可以通过几种不同的方式在外部安排 dag_runs:
- 通过Airflow CLI
- 在 python 脚本中使用 Local client
- 通过Airflow REST API
- 通过 Web 中的触发按钮手动 UI