运行 简单 Airflow BashOperator 时出现 TemplateNotFound 错误
TemplateNotFound error when running simple Airflow BashOperator
我正在尝试编写我们的第一个 Airflow DAG,当我尝试使用命令 airflow list_tasks orderwarehouse
:
列出任务时出现以下错误
Traceback (most recent call last):
File "/usr/local/lib/python2.7/site-packages/airflow/models.py", line 2038, in resolve_template_files
setattr(self, attr, env.loader.get_source(env, content)[0])
File "/usr/local/lib/python2.7/site-packages/jinja2/loaders.py", line 187, in get_source
raise TemplateNotFound(template)
TemplateNotFound: ./home/deploy/airflow-server/task_scripts/orderwarehouse/load_warehouse_tables.sh
此 DAG 不应使用模板。我只是尝试按照 the docs 中的说明 运行 指定位置的 shell 脚本。 shell 脚本确实存在于该位置并且拼写正确。我的 DAG 看起来像这样:
from airflow import DAG
from airflow.operators.bash_operator import BashOperator
default_args = {
'owner': 'airflow',
'depends_on_past': False,
'start_date': datetime(2015, 6, 1),
'email': ['airflow@airflow.com'],
'email_on_failure': False,
'email_on_retry': False,
'retries': 1,
'retry_delay': timedelta(minutes=5),
# 'queue': 'bash_queue',
# 'pool': 'backfill',
# 'priority_weight': 10,
# 'end_date': datetime(2016, 1, 1),
}
orderwarehouse = DAG('orderwarehouse', default_args=default_args)
load_mysql = BashOperator(
task_id='load_warehouse_mysql',
bash_command='./home/deploy/airflow-server/task_scripts/orderwarehouse/load_warehouse_tables.sh',
dag=orderwarehouse)
不确定为什么它认为需要查找 Jinja 模板。 运行 没有关于这个的想法,如果有人能指出我误入歧途的地方,我将不胜感激。谢谢。
这是气流的陷阱。在 bash_command 的末尾添加一个 space 它应该 运行 没问题
来源:
https://cwiki.apache.org/confluence/pages/viewpage.action?pageId=62694614
您应该尝试在文件路径末尾使用 space。无论您使用哪个运算符,都应始终遵循相同的规则。
load_mysql = BashOperator(
task_id='load_warehouse_mysql',
command='/home/deploy/airflow-server/task_scripts/orderwarehouse/load_warehouse_tables.sh ',
dag=orderwarehouse)
除了提供的所有答案之外,我还必须做更多的事情来摆脱找不到 jinja 模板的问题。
我们必须在任务定义中的文件名后添加space。
我正在尝试编写我们的第一个 Airflow DAG,当我尝试使用命令 airflow list_tasks orderwarehouse
:
Traceback (most recent call last):
File "/usr/local/lib/python2.7/site-packages/airflow/models.py", line 2038, in resolve_template_files
setattr(self, attr, env.loader.get_source(env, content)[0])
File "/usr/local/lib/python2.7/site-packages/jinja2/loaders.py", line 187, in get_source
raise TemplateNotFound(template)
TemplateNotFound: ./home/deploy/airflow-server/task_scripts/orderwarehouse/load_warehouse_tables.sh
此 DAG 不应使用模板。我只是尝试按照 the docs 中的说明 运行 指定位置的 shell 脚本。 shell 脚本确实存在于该位置并且拼写正确。我的 DAG 看起来像这样:
from airflow import DAG
from airflow.operators.bash_operator import BashOperator
default_args = {
'owner': 'airflow',
'depends_on_past': False,
'start_date': datetime(2015, 6, 1),
'email': ['airflow@airflow.com'],
'email_on_failure': False,
'email_on_retry': False,
'retries': 1,
'retry_delay': timedelta(minutes=5),
# 'queue': 'bash_queue',
# 'pool': 'backfill',
# 'priority_weight': 10,
# 'end_date': datetime(2016, 1, 1),
}
orderwarehouse = DAG('orderwarehouse', default_args=default_args)
load_mysql = BashOperator(
task_id='load_warehouse_mysql',
bash_command='./home/deploy/airflow-server/task_scripts/orderwarehouse/load_warehouse_tables.sh',
dag=orderwarehouse)
不确定为什么它认为需要查找 Jinja 模板。 运行 没有关于这个的想法,如果有人能指出我误入歧途的地方,我将不胜感激。谢谢。
这是气流的陷阱。在 bash_command 的末尾添加一个 space 它应该 运行 没问题
来源: https://cwiki.apache.org/confluence/pages/viewpage.action?pageId=62694614
您应该尝试在文件路径末尾使用 space。无论您使用哪个运算符,都应始终遵循相同的规则。
load_mysql = BashOperator(
task_id='load_warehouse_mysql',
command='/home/deploy/airflow-server/task_scripts/orderwarehouse/load_warehouse_tables.sh ',
dag=orderwarehouse)
除了提供的所有答案之外,我还必须做更多的事情来摆脱找不到 jinja 模板的问题。
我们必须在任务定义中的文件名后添加space。