正在从基于 Web 的源将 XML 数据导入 Google 工作表
Importing XML Data into Google Sheets from a Web-based Source
我正在尝试构建一个 Google Sheet 以从通过 AWS S3 托管的 IRS 表格 990 存储库中提取信息。
这是 XML 文件:Example 990 Form in XML
我正在执行的查询旨在从 XML 源中提取附表 I 部分下的公司名称。公司名称包含在 BusinessNameLine1Txt
标签中。
利用 Google Sheet 中的内置 IMPORTXML
函数,我构建了以下内容:
=IMPORTXML("https://s3.amazonaws.com/irs-form-990/201702299349300445_public.xml", "//Return/ReturnData/IRS990ScheduleI/RecipientTable/RecipientBusinessName/BusinessNameLine1Txt")
当我使用上面看到的参数执行函数时,我收到一条错误消息,指出导入的内容为空。我的 XPATH 查询是不正确的还是与数据中的某些怪癖有关?
这个修改怎么样?
=IMPORTXML(A1, "//*[local-name()='BusinessNameLine1Txt']")
https://s3.amazonaws.com/irs-form-990/201702299349300445_public.xml
放在 "A1".
结果:
参考:
如果我误解了你的问题,请告诉我。我想修改一下。
编辑:
=IMPORTXML(A1, "//*[local-name()='IRS990ScheduleI']//*[local-name()='BusinessNameLine1Txt']")
结果:
我正在尝试构建一个 Google Sheet 以从通过 AWS S3 托管的 IRS 表格 990 存储库中提取信息。
这是 XML 文件:Example 990 Form in XML
我正在执行的查询旨在从 XML 源中提取附表 I 部分下的公司名称。公司名称包含在 BusinessNameLine1Txt
标签中。
利用 Google Sheet 中的内置 IMPORTXML
函数,我构建了以下内容:
=IMPORTXML("https://s3.amazonaws.com/irs-form-990/201702299349300445_public.xml", "//Return/ReturnData/IRS990ScheduleI/RecipientTable/RecipientBusinessName/BusinessNameLine1Txt")
当我使用上面看到的参数执行函数时,我收到一条错误消息,指出导入的内容为空。我的 XPATH 查询是不正确的还是与数据中的某些怪癖有关?
这个修改怎么样?
=IMPORTXML(A1, "//*[local-name()='BusinessNameLine1Txt']")
https://s3.amazonaws.com/irs-form-990/201702299349300445_public.xml
放在 "A1".
结果:
参考:
如果我误解了你的问题,请告诉我。我想修改一下。
编辑:
=IMPORTXML(A1, "//*[local-name()='IRS990ScheduleI']//*[local-name()='BusinessNameLine1Txt']")