我应该如何构建我的张量流数据集以将其输入自定义 RNN 估计器
How should I build my tensorflow dataset for feeding it into a custom RNN estimator
我正在尝试使用 custom estimator RNN 来估计我网站上的客户是否会根据他们的点击行为购买商品。所以数据集看起来像:
session_id page_type event since_previous_click (s) will_buy
1 search SelectCountry null 0
1 search SelectCountry 2 0
1 search SortResults 4 0
1 product SelectColor 20 0
2 search SelectCountry null 1
2 search SortResults 10 1
2 product SelectSize 5 1
2 product SelectColor 23 1
2 inmarket EnterName 8 1
2 inmarket Booked 34 1
所以"will_buy"是标签,page_type、事件和since_previous_click是输入特征。然而,我的问题是我不知道如何构建我的 input dataset。我知道维度应该是 [#data points, #time steps, #features],其中应该填充时间步数,因为它们的长度不同。但是我不能从张量(或 numpy 数组)构造这个 3D 对象,因为有多个数据类型(字符串和 int32)。有帮助吗?
将页面类型和事件转换为单热向量。那么你所有的数据都将是 int32.
我正在尝试使用 custom estimator RNN 来估计我网站上的客户是否会根据他们的点击行为购买商品。所以数据集看起来像:
session_id page_type event since_previous_click (s) will_buy
1 search SelectCountry null 0
1 search SelectCountry 2 0
1 search SortResults 4 0
1 product SelectColor 20 0
2 search SelectCountry null 1
2 search SortResults 10 1
2 product SelectSize 5 1
2 product SelectColor 23 1
2 inmarket EnterName 8 1
2 inmarket Booked 34 1
所以"will_buy"是标签,page_type、事件和since_previous_click是输入特征。然而,我的问题是我不知道如何构建我的 input dataset。我知道维度应该是 [#data points, #time steps, #features],其中应该填充时间步数,因为它们的长度不同。但是我不能从张量(或 numpy 数组)构造这个 3D 对象,因为有多个数据类型(字符串和 int32)。有帮助吗?
将页面类型和事件转换为单热向量。那么你所有的数据都将是 int32.