我们可以从我们的 DataStage 作业中生成数据沿袭吗?

Can we generate a data lineage from our DataStage Jobs?

我们使用的是 IBM DataStage 11.7.1

项目中未使用元数据资产管理器。

我们能否从现有和已使用的作业中生成数据沿袭(知道不能 100% 覆盖)?如果是:如何?

您只能使用 DataStage 在作业中生成沿袭。也就是说,您可以在一项工作的上下文中回答“显示数据流向何处”和“显示数据来自何处”的问题。您可以通过右键单击您有兴趣提出问题的阶段来访问此功能。

除此之外,您还可以使用信息治理目录工具更正式地生成数据沿袭。如果您不使用共享元数据资源,并且在 运行 作业时不生成操作元数据,那么沿袭报告将仅基于设计数据。

如果您将作业中使用的 table 定义共享到公共元数据存储库(从 DataStage Designer 的存储库菜单),那么您将在 IGC 中获得更好的沿袭结果。如果您在 运行 作业时生成操作元数据,那么这些操作元数据也将在沿袭报告中可用。

不要忘记默认情况下 DataStage 作业不包含在沿袭中。您至少需要在 IGC 的管理页面中将感兴趣的职位标记为“include for lineage”。