Airflow 与 BgQuery Error 集成

Airflow integration with BgQuery Error

我已经安装了 airflow 并编写了一个 DAG 来将 MySQL 数据与 BigQuery 集成。

当我 运行 python 脚本时,出现以下错误:

ImportError: cannot import name GbqConnector

我按照说明将 pandas 降级到旧版本。当我这样做时,我得到了一个不同的错误:

ImportError: cannot import name _test_google_api_imports

编辑:建议来自 x97Core 工作。

我现在有一个不同的问题。我收到以下错误:

/usr/local/lib/python2.7/dist-packages/airflow/models.py:1927: PendingDeprecationWarning: Invalid arguments were passed to MySqlToGoogleCloudStorageOperator. Support for passing such arguments will be dropped in Airflow 2.0. Invalid arguments were:

*args: ()

**kwargs: {'google_cloud_storage_connn_id': 'podioGCPConnection'} category=PendingDeprecationWarning

/usr/local/lib/python2.7/dist-packages/airflow/models.py:1927: PendingDeprecationWarning: Invalid arguments were passed to GoogleCloudStorageToBigQueryOperator. Support for passing such arguments will be dropped in Airflow 2.0. Invalid arguments were:

*args: ()

**kwargs: {'project_id': 'podio-data'} category=PendingDeprecationWarning

根据此 link,问题在于气流与 python2 和 python3 的兼容性。我已经尝试 运行ning 两者的代码,但仍然出现相同的错误。 Airflow mysql to gcp Dag error

有谁知道是否有解决方案?

这可能有点复杂。 我建议您阅读这两个很棒的链接

https://wecode.wepay.com/posts/wepays-data-warehouse-bigquery-airflow

和 Van Boxel 的介质

https://medium.com/google-cloud/airflow-for-google-cloud-part-1-d7da9a048aa4

刚刚 运行 进入这个问题。

降级 pandas 版本似乎可行(在 Airflow v1.8.0 上测试):

pip install pandas==0.18.1

更多详情:https://issues.apache.org/jira/browse/AIRFLOW-1179

或者如果您使用的是 Airflow 1.8.2 或更高版本。

pip install pandas-gbq