Spark JobServer 可以使用 Cassandra 作为 SharedDb

Spark JobServer can use Cassandra as SharedDb

我一直在研究如何使用 Cassandra 配置 Spark JobServer 后端 (SharedDb)。

而且我在 SJS 文档中看到他们将 Cassandra 列为可以使用的共享数据库之一。

这是文档部分:

Spark Jobserver offers a variety of options for backend storage such as:

H2/PostreSQL or other SQL Databases

Cassandra

Combination of SQL DB or Zookeeper with HDFS

但是我没有找到任何配置示例。

谁能举个例子?或者可以帮我配置一下吗?

已编辑:

我想使用 Cassandra 存储来自 Spark JobServer 的元数据和作业。所以,我可以通过这些服务器后面的代理访问任何服务器。

以前版本的 Jobserver 支持 Cassandra。您只需要有 Cassandra 运行,将正确的设置添加到 Jobserver 的配置文件中:https://github.com/spark-jobserver/spark-jobserver/blob/0.8.0/job-server/src/main/resources/application.conf#L60 并将 spark.jobserver.io.JobCassandraDAO 指定为 DAO。

但是 Cassandra DAO 最近被弃用并从项目中删除,因为它并没有真正被社区使用和维护。