如何在 Vertex AI 表格预测中分配两个或多个时间序列标识符列
How to assign two or more time series identifier columns in Vertex AI Tabular Forecasting
我想知道模型中是否可以有多个时间序列标识符列?假设我想在产品和商店级别创建预测(文档建议这样做应该是可能的)。
如果我 select 产品作为系列标识符,我留给商店的唯一选项是协变量或属性,两者均不适用于这种情况。
连接产品和商店并将该连接 ID 的单个产品和商店代码值用作属性是否是一种解决方案?感觉不对,但我看不到任何其他选项 - 我是否遗漏了什么?
注意:据我所知,Vertex AI 的此功能目前处于预览阶段,因此选项可能会受到限制。
在 的 预测模型 中,没有其他方法可以分配 2 个或更多 时间序列标识符 顶点AI。 “预测模型”在“Preview”Product launch stage, as you are aware, with all consequences of that fact the options are limited. Please refer to this doc中,以获取有关训练预测的数据准备最佳实践的更多信息型号。
作为解决方法,可以将两列连接起来,并在该连接的列上分配一个时间序列标识符,正如您在问题中提到的那样。这样,串联的列将更多的上下文信息带入模型的训练中。
只是为了跟进 Vishal 的(正确)回答,以防将来有人查看此内容。
是的,串联是目前唯一的选择,因为只能有一个时间序列标识符(我希望将来会改变)。话虽如此,我已经尝试在数据中添加个人标识符作为分类属性,而且效果很好。通过这种方式,我在 product/store 级别生成了预测,但我可以汇总单个产品的所有预测,并且结果与根据汇总数据训练的模型相差不大(显然这取决于需求分类和选择的优化)方法等因素)。
另外,一个有趣的观察。当您包含产品描述等内容时,您可以将它们分类为分类或文本。我无法在文档中找到该模型是否仅使用 unigrams(这是控制台中的列统计信息所建议的)或许多 n-grams,但这绝对是您想要试验的东西数据。当使用分类分类时,我的数据集实际上显示出更好的准确性,这有点违反直觉,因为它感觉像是冗余信息,尽管由于文档不是很详细所以很难说。它可能特定于我的数据集,所以正如我所说,请确保你用你的数据集进行试验。
我想知道模型中是否可以有多个时间序列标识符列?假设我想在产品和商店级别创建预测(文档建议这样做应该是可能的)。
如果我 select 产品作为系列标识符,我留给商店的唯一选项是协变量或属性,两者均不适用于这种情况。
连接产品和商店并将该连接 ID 的单个产品和商店代码值用作属性是否是一种解决方案?感觉不对,但我看不到任何其他选项 - 我是否遗漏了什么?
注意:据我所知,Vertex AI 的此功能目前处于预览阶段,因此选项可能会受到限制。
在 的 预测模型 中,没有其他方法可以分配 2 个或更多 时间序列标识符 顶点AI。 “预测模型”在“Preview”Product launch stage, as you are aware, with all consequences of that fact the options are limited. Please refer to this doc中,以获取有关训练预测的数据准备最佳实践的更多信息型号。
作为解决方法,可以将两列连接起来,并在该连接的列上分配一个时间序列标识符,正如您在问题中提到的那样。这样,串联的列将更多的上下文信息带入模型的训练中。
只是为了跟进 Vishal 的(正确)回答,以防将来有人查看此内容。
是的,串联是目前唯一的选择,因为只能有一个时间序列标识符(我希望将来会改变)。话虽如此,我已经尝试在数据中添加个人标识符作为分类属性,而且效果很好。通过这种方式,我在 product/store 级别生成了预测,但我可以汇总单个产品的所有预测,并且结果与根据汇总数据训练的模型相差不大(显然这取决于需求分类和选择的优化)方法等因素)。
另外,一个有趣的观察。当您包含产品描述等内容时,您可以将它们分类为分类或文本。我无法在文档中找到该模型是否仅使用 unigrams(这是控制台中的列统计信息所建议的)或许多 n-grams,但这绝对是您想要试验的东西数据。当使用分类分类时,我的数据集实际上显示出更好的准确性,这有点违反直觉,因为它感觉像是冗余信息,尽管由于文档不是很详细所以很难说。它可能特定于我的数据集,所以正如我所说,请确保你用你的数据集进行试验。