在 sparklyr 中使用 ft_one_hot_encoder() 时出错
Error when using ft_one_hot_encoder() in sparklyr
我有一个包含分类变量的数据集,我想在 sparklyr
中使用单热编码对其进行编码。下面是 table 头部,以及我正在使用的代码:
tbl_name %>%
ft_one_hot_encoder(input_col="category",output_col="category_x")
但是,我收到以下错误:
java.lang.IllegalArgumentException: requirement failed: Input column must be of type numeric but got string
。我可能在这里遗漏了一些东西,但是单热编码器的输入列怎么可以是数字?
阅读 Luraschi 的书,在 sparklyr
中应用 ft_one_hot_encoder()
之前需要使用 ft_string_indexer()
。
我有一个包含分类变量的数据集,我想在 sparklyr
中使用单热编码对其进行编码。下面是 table 头部,以及我正在使用的代码:
tbl_name %>%
ft_one_hot_encoder(input_col="category",output_col="category_x")
但是,我收到以下错误:
java.lang.IllegalArgumentException: requirement failed: Input column must be of type numeric but got string
。我可能在这里遗漏了一些东西,但是单热编码器的输入列怎么可以是数字?
阅读 Luraschi 的书,在 sparklyr
中应用 ft_one_hot_encoder()
之前需要使用 ft_string_indexer()
。