apache-spark-1.6
-
Spark 1.6 Streaming consumer reading in kafka offset stuck at createDirectStream
-
在 Spark 中从包含字符串数组的 RDD 创建 SQLContext 数据集
-
加入两个数据帧时 CassandraSourceRelation 不可序列化
-
Spark - 将 RDD[Vector] 转换为具有可变列的 DataFrame
-
如何通过 Spark 属性 (Spark 1.6) 在 spark-shell 中启用或禁用 Hive 支持?
-
广播'对象没有属性'destroy'?
-
Apache spark WHERE 子句不起作用
-
为什么在 spark-shell 中导入 SparkSession 会失败并显示 "object SparkSession is not a member of package org.apache.spark.sql"?
-
如何提取数组的 ElementType 作为 StructType 的实例
-
Exception in thread "main" java.lang.NoClassDefFoundError: org/apache/spark/sql/SQLContext
-
如何加入二进制字段?
-
每种格式的写作或阅读选项参考在哪里?
-
为什么单个测试失败 "Error XSDB6: Another instance of Derby may have already booted the database"?
-
Spark CSV 包无法在字段内处理 \n
-
为什么从 Cassandra table 读取数据集时 Spark 应用程序的执行时间比本地文件更长?
-
为什么从 CSV 读取失败并出现 NumberFormatException?
-
计算每组的最大观察数
-
为什么 Spark Streaming 不读取 Kafka 主题?
-
scala dataframe 过滤字符串数组
-
Pivot spark scala 数据框