如何在Kubernetes环境下实现spark-cassandra connector的"repartitionByCassandraReplica "？

How to achieve spark-cassandra connector's "repartitionByCassandraReplica " in Kubernetes environment?

cassandra
spark-cassandra-connector

我看到了这个问题（Question Link) here. I think it might not be possible to co locate spark workers/executors on same machine in Kubernetes environment. Answer to the question 看起来是正确的。我想知道 spark-cassandra-connector 是否提供了任何其他方法来在 Kubernetes 环境中实现类似的功能。

除非您将 Cassandra 和 Spark 部署在同一容器中，否则根据定义，Cassandra 数据不能位于 Spark 本地 worker/executor。

正如我在对 https://community.datastax.com/questions/11464/ 的回答中所解释的那样，Cassandra 和 Spark JVM 必须存在于同一个 container/VM/server 中，数据才能成为本地数据。干杯！