如何在没有 Cassandra 的情况下在 Datastax Enterprise 中启动 Spark

How to start Spark without Cassandra in Datastax Enterprise

我最近在我的 5 节点集群中安装了 DataStax Enterprise (v5.0)。我计划将 3 个节点用作 spark,将 2 个节点用作 cassandra 多节点集群。

现在每当我尝试在我的 spark 节点中启动 spark -

我收到以下错误 -

sudo dse 火花 线程 "main" java.io.IOException 中的异常:无法在 {127.0.0.1}:9042 打开与 Cassandra 的本机连接 在 com.datastax.spark.connector.cql.CassandraConnector$.com$datastax$spark$connector$cql$CassandraConnector$$createSession(CassandraConnector.scala:160)

为什么spark要找cassandra?在 DSE 中没有 cassandra 就无法启动 spark 吗?

我还应该更改 DSE 中的哪些 conf 文件,以便 spark 连接到另一个节点上的 cassandra 运行(而不是位于 127.0.0.1:9042 的本地 运行)

您目前 (5.0) 无法在没有 Cassandra 的情况下启动 DSE 节点。但仅仅因为您必须启动 Cassandra 并不意味着您必须使用它。只需确保您始终使用网络拓扑策略,DSE 将仅在这些机器上使用 C* 来获取八卦和模式信息。

另请注意 dse spark 刚刚点燃火花 shell。它不会启动 Spark Master 和 Worker 基础设施。