关于分桶特征列如何工作的困惑

Confusion about how bucketized feature columns work

我对分桶特征列如何表示模型的输入有些困惑。根据 blog post on feature columns, when we bucketize a feature like year this puts each value in buckets based on the defined boundaries, and creates a binary vector, turning on each bucket based on the input value, but the example in the documentation 显示输出为单个整数。当使用分桶列时,我对模型的输入方式感到困惑。谁能帮我澄清一下?

从估计器的第一个隐藏层的维度来看,似乎对于 tf.feature_column.bucketized_column 的每个特征列,都会根据边界创建一个热编码向量。