Spark JobServer 可以使用 Cassandra 作为 SharedDb
Spark JobServer can use Cassandra as SharedDb
我一直在研究如何使用 Cassandra 配置 Spark JobServer 后端 (SharedDb)。
而且我在 SJS 文档中看到他们将 Cassandra 列为可以使用的共享数据库之一。
这是文档部分:
Spark Jobserver offers a variety of options for backend storage such as:
H2/PostreSQL or other SQL Databases
Cassandra
Combination of SQL DB or Zookeeper with HDFS
但是我没有找到任何配置示例。
谁能举个例子?或者可以帮我配置一下吗?
已编辑:
我想使用 Cassandra 存储来自 Spark JobServer 的元数据和作业。所以,我可以通过这些服务器后面的代理访问任何服务器。
以前版本的 Jobserver 支持 Cassandra。您只需要有 Cassandra 运行,将正确的设置添加到 Jobserver 的配置文件中:https://github.com/spark-jobserver/spark-jobserver/blob/0.8.0/job-server/src/main/resources/application.conf#L60 并将 spark.jobserver.io.JobCassandraDAO
指定为 DAO。
但是 Cassandra DAO 最近被弃用并从项目中删除,因为它并没有真正被社区使用和维护。
我一直在研究如何使用 Cassandra 配置 Spark JobServer 后端 (SharedDb)。
而且我在 SJS 文档中看到他们将 Cassandra 列为可以使用的共享数据库之一。
这是文档部分:
Spark Jobserver offers a variety of options for backend storage such as:
H2/PostreSQL or other SQL Databases
Cassandra
Combination of SQL DB or Zookeeper with HDFS
但是我没有找到任何配置示例。
谁能举个例子?或者可以帮我配置一下吗?
已编辑:
我想使用 Cassandra 存储来自 Spark JobServer 的元数据和作业。所以,我可以通过这些服务器后面的代理访问任何服务器。
以前版本的 Jobserver 支持 Cassandra。您只需要有 Cassandra 运行,将正确的设置添加到 Jobserver 的配置文件中:https://github.com/spark-jobserver/spark-jobserver/blob/0.8.0/job-server/src/main/resources/application.conf#L60 并将 spark.jobserver.io.JobCassandraDAO
指定为 DAO。
但是 Cassandra DAO 最近被弃用并从项目中删除,因为它并没有真正被社区使用和维护。