TensorForest 分类特征

TensorForest categorical features

看起来像 TensorForest,TensorFlow 中的随机森林实现,以某种方式支持分类特征作为输入(没有单热编码)。

但是不清楚如何使用它们。

如果你看这个例子

第 65 行的 'x' 参数

必须是浮点数组。

如何传递分类特征(例如字符串)?

将 SKCompat 包装器用于估算器时,'x' 和 'y' 参数确实需要是浮点数(因为使用该接口只能传入一个对象)。然而,使用大多数示例使用的估计器的输入函数接口(input_fn=...),input_fn returns 的特征字典可以是 floats、int 和 string Tensors 的混合.浮点数被视为连续的,整数和字符串被视为分类的(创建 x[i] == T 决策节点而不是 x[i] <= T)并且不需要单热编码。因此,您需要创建一个输入函数来处理 returns 批数据(这实际上是 SKCompat 接口为您所做的)。