是否有一些云解决方案可以在 Python 中训练模型而不是在 GBQ 中导入结果?
Is there some cloud solutions to train model in Python and than import result in GBQ?
我使用 pd.read_gbq() 从 Jupiter Notebook 中的 GBQ 加载数据。然后我对它们进行预处理并建立 ML 模型(我知道 BigQueryML,但这还不足以完成我的任务)。我知道如何在 GBQ 中加载结果,但我不知道如何自动加载结果。我需要训练模型并每天进行预测。云服务有一些机会吗?也许使用 Colab?
使用 Google AI Platform,您可以完全在线训练和请求预测。您可以使用通过 Tensorflow、scikit-learn 或 XGBoost 创建的模型,并进行批量(仅限 Tensorflow)和在线预测。您还可以创建、存储和质疑同一模型的不同版本。
您可以使用 Google Cloud Composer,是一项允许用户管理工作流编排的服务,可以让您安排和监控管道,它建立在 Apache Airflow 之上,您可以使用 Python 编写复杂的工作流。
Composer使用DAG's(有向无环图),DAG的每个顶点代表一个任务,边代表下一个任务的方向。
因此,您可以安排一个 DAG 从 BigQuery 加载数据,训练您的 ML 模型,然后将结果加载到 BigQuery。
我给你写一个DAG with python的指南,Python运算符也有与BigQuery或Tensoflow交互的包。
我使用 pd.read_gbq() 从 Jupiter Notebook 中的 GBQ 加载数据。然后我对它们进行预处理并建立 ML 模型(我知道 BigQueryML,但这还不足以完成我的任务)。我知道如何在 GBQ 中加载结果,但我不知道如何自动加载结果。我需要训练模型并每天进行预测。云服务有一些机会吗?也许使用 Colab?
使用 Google AI Platform,您可以完全在线训练和请求预测。您可以使用通过 Tensorflow、scikit-learn 或 XGBoost 创建的模型,并进行批量(仅限 Tensorflow)和在线预测。您还可以创建、存储和质疑同一模型的不同版本。
您可以使用 Google Cloud Composer,是一项允许用户管理工作流编排的服务,可以让您安排和监控管道,它建立在 Apache Airflow 之上,您可以使用 Python 编写复杂的工作流。
Composer使用DAG's(有向无环图),DAG的每个顶点代表一个任务,边代表下一个任务的方向。
因此,您可以安排一个 DAG 从 BigQuery 加载数据,训练您的 ML 模型,然后将结果加载到 BigQuery。
我给你写一个DAG with python的指南,Python运算符也有与BigQuery或Tensoflow交互的包。