Sparklyr - 更改 Spark 数据框中的列名称

Sparklyr - Change columns names in a Spark dataframe

df <- data.frame(old1 = LETTERS, old2 = 1)
df_tbl <- copy_to(sc,df,"df")

df_tbl <- df_tbl %>% dplyr::rename(old1 = new1, old2 = new2)

returns:

> head(df_tbl)
Error: `new1`, `new2` contains unknown variables

是否有使用 Sparklyr 更改列名称的简单方法?

首先你把顺序混了:

df_tbl %>% rename(new1 = old1, new2 = old2)

但是对于 Sparklyr,您必须使用 select:

df_tbl %>% select(new1 = old1, new2 = old2)