如何在 Vertex AI 表格预测中分配两个或多个时间序列标识符列

How to assign two or more time series identifier columns in Vertex AI Tabular Forecasting

google-cloud-vertex-ai

我想知道模型中是否可以有多个时间序列标识符列？假设我想在产品和商店级别创建预测（文档建议这样做应该是可能的）。

如果我 select 产品作为系列标识符，我留给商店的唯一选项是协变量或属性，两者均不适用于这种情况。

连接产品和商店并将该连接 ID 的单个产品和商店代码值用作属性是否是一种解决方案？感觉不对，但我看不到任何其他选项 - 我是否遗漏了什么？

注意：据我所知，Vertex AI 的此功能目前处于预览阶段，因此选项可能会受到限制。

在 的 预测模型 中，没有其他方法可以分配 2 个或更多 时间序列标识符 顶点AI。 “预测模型”在“Preview”Product launch stage, as you are aware, with all consequences of that fact the options are limited. Please refer to this doc中，以获取有关训练预测的数据准备最佳实践的更多信息型号。

作为解决方法，可以将两列连接起来，并在该连接的列上分配一个时间序列标识符，正如您在问题中提到的那样。这样，串联的列将更多的上下文信息带入模型的训练中。

只是为了跟进 Vishal 的（正确）回答，以防将来有人查看此内容。

是的，串联是目前唯一的选择，因为只能有一个时间序列标识符（我希望将来会改变）。话虽如此，我已经尝试在数据中添加个人标识符作为分类属性，而且效果很好。通过这种方式，我在 product/store 级别生成了预测，但我可以汇总单个产品的所有预测，并且结果与根据汇总数据训练的模型相差不大（显然这取决于需求分类和选择的优化）方法等因素）。

另外，一个有趣的观察。当您包含产品描述等内容时，您可以将它们分类为分类或文本。我无法在文档中找到该模型是否仅使用 unigrams（这是控制台中的列统计信息所建议的）或许多 n-grams，但这绝对是您想要试验的东西数据。当使用分类分类时，我的数据集实际上显示出更好的准确性，这有点违反直觉，因为它感觉像是冗余信息，尽管由于文档不是很详细所以很难说。它可能特定于我的数据集，所以正如我所说，请确保你用你的数据集进行试验。

如何在 Vertex AI 表格预测中分配两个或多个时间序列标识符列

How to assign two or more time series identifier columns in Vertex AI Tabular Forecasting

google-cloud-vertex-ai