如何在Kubernetes环境下实现spark-cassandra connector的"repartitionByCassandraReplica "?

How to achieve spark-cassandra connector's "repartitionByCassandraReplica " in Kubernetes environment?

我看到了这个问题(Question Link) here. I think it might not be possible to co locate spark workers/executors on same machine in Kubernetes environment. Answer to the question 看起来是正确的。我想知道 spark-cassandra-connector 是否提供了任何其他方法来在 Kubernetes 环境中实现类似的功能。

除非您将 Cassandra 和 Spark 部署在同一容器中,否则根据定义,Cassandra 数据不能位于 Spark 本地 worker/executor。

正如我在对 https://community.datastax.com/questions/11464/ 的回答中所解释的那样,Cassandra 和 Spark JVM 必须存在于同一个 container/VM/server 中,数据才能成为本地数据。干杯!