如何在 sparkR 中创建单列 DataFrame?

How to create a single column DataFrame in sparkR?

如何在 SparkR 中创建单列 DataFrame?假设我们有以下列 x,我如何从中创建一个 DataFrame

## Assumes a running sparkR shell
data("ChickWeight")
cwDF <- createDataFrame(sqlContext, ChickWeight)
x <- cwDF$Chick

似乎有一个通用的 toDF 函数,但没有方法。知道如何将 x 更改为单列 DataFrame 对象吗?

x.df <- data.frame(Chick = x)

只需使用select函数:

chicks <- select(cwDF, cwDF$Chick)
head(chicks)

##   Chick
## 1     1
## 2     1
## 3     1
## 4     1
## 5     1
## 6     1

你必须使用select函数,

x <- select(cwDF,"Chick")

而不是 x <- cwDF$Chick 这是一个 r 代码。 我们在 sparkR shell,

中得到如下图所示的结果