如何获取 saveToCassandra 并使用它?
how to get saveToCassandra and use it?
我正在使用 spark-sql v2.3.1 将数据写入 cassandra v3.11.1。
要将数据帧写入 cassandra table 我们可以使用
df.write.format("org.apache.spark.sql.cassandra")
.options(Map( "table" -> tname, "keyspace" -> keyspacename ))
.mode(SaveMode.Append)
.save();
但是同一个版本怎么用saveToCassandra()
方法
我需要添加任何罐子吗,我已经添加了 spark-cassandra-connector 和 cassandra-driver-core。我需要添加更多的罐子吗?我得到一个 sparksession 作为 spark,它不支持 createDateFrame()
。
sc = spark.sparkContext;
在 sc 上我们可以调用 saveToCassandra();
saveToCassandra
在同一个包中,但它 works on RDD,不在 DataFrames 上。所以,如果你想使用那个命令(真的应该是一个很好的理由),你只需要通过说 df.rdd
并调用 saveToCassandra
从数据框中获取 RDD。
我正在使用 spark-sql v2.3.1 将数据写入 cassandra v3.11.1。 要将数据帧写入 cassandra table 我们可以使用
df.write.format("org.apache.spark.sql.cassandra")
.options(Map( "table" -> tname, "keyspace" -> keyspacename ))
.mode(SaveMode.Append)
.save();
但是同一个版本怎么用saveToCassandra()
方法
我需要添加任何罐子吗,我已经添加了 spark-cassandra-connector 和 cassandra-driver-core。我需要添加更多的罐子吗?我得到一个 sparksession 作为 spark,它不支持 createDateFrame()
。
sc = spark.sparkContext;
在 sc 上我们可以调用 saveToCassandra();
saveToCassandra
在同一个包中,但它 works on RDD,不在 DataFrames 上。所以,如果你想使用那个命令(真的应该是一个很好的理由),你只需要通过说 df.rdd
并调用 saveToCassandra
从数据框中获取 RDD。