Google 云平台上的计划 mapreduce 作业

Scheduled mapreduce job on Google Cloud Platform

我正在开发一个 node.js 应用程序,它基本上 将用户事件日志存储在数据库中并显示有关用户操作的见解 。 为实现此事件日志,必须使用 Mapreduce 作业进行分析,该作业将 运行 每天自动 一次(每晚)。

我在 google 云网站上找到了很多关于 mapreduce 的教程,但我完全迷路了,因为有多种技术,并且无法找到不使用命令行的方法也没有关于调度的信息(我希望整个分析过程完全自动化

请问我应该使用哪些 google 技术或在哪里可以找到好的教程?

谢谢

您想看:

  1. Dataproc(运行 Hadoop/Spark 个开箱即用的工作)
  2. Dataflow(使用 Dataflow/Beam 编程模型开发 'pipelines')