我应该如何构建我的张量流数据集以将其输入自定义 RNN 估计器

How should I build my tensorflow dataset for feeding it into a custom RNN estimator

我正在尝试使用 custom estimator RNN 来估计我网站上的客户是否会根据他们的点击行为购买商品。所以数据集看起来像:

session_id  page_type   event            since_previous_click (s)   will_buy
1           search      SelectCountry    null                        0
1           search      SelectCountry    2                           0
1           search      SortResults      4                           0
1           product     SelectColor      20                          0
2           search      SelectCountry    null                        1
2           search      SortResults      10                          1
2           product     SelectSize       5                           1
2           product     SelectColor      23                          1
2           inmarket    EnterName        8                           1
2           inmarket    Booked           34                          1

所以"will_buy"是标签,page_type、事件和since_previous_click是输入特征。然而,我的问题是我不知道如何构建我的 input dataset。我知道维度应该是 [#data points, #time steps, #features],其中应该填充时间步数,因为它们的长度不同。但是我不能从张量(或 numpy 数组)构造这个 3D 对象,因为有多个数据类型(字符串和 int32)。有帮助吗?

将页面类型和事件转换为单热向量。那么你所有的数据都将是 int32.