正在从基于 Web 的源将 XML 数据导入 Google 工作表

Importing XML Data into Google Sheets from a Web-based Source

我正在尝试构建一个 Google Sheet 以从通过 AWS S3 托管的 IRS 表格 990 存储库中提取信息。

这是 XML 文件:Example 990 Form in XML

我正在执行的查询旨在从 XML 源中提取附表 I 部分下的公司名称。公司名称包含在 BusinessNameLine1Txt 标签中。

利用 Google Sheet 中的内置 IMPORTXML 函数,我构建了以下内容:

=IMPORTXML("https://s3.amazonaws.com/irs-form-990/201702299349300445_public.xml", "//Return/ReturnData/IRS990ScheduleI/RecipientTable/RecipientBusinessName/BusinessNameLine1Txt")

当我使用上面看到的参数执行函数时,我收到一条错误消息,指出导入的内容为空。我的 XPATH 查询是不正确的还是与数据中的某些怪癖有关?

这个修改怎么样?

=IMPORTXML(A1, "//*[local-name()='BusinessNameLine1Txt']")
  • https://s3.amazonaws.com/irs-form-990/201702299349300445_public.xml 放在 "A1".

结果:

参考:

如果我误解了你的问题,请告诉我。我想修改一下。

编辑:

=IMPORTXML(A1, "//*[local-name()='IRS990ScheduleI']//*[local-name()='BusinessNameLine1Txt']")

结果: