如何检查 URL 是否包含 XML 文件?
How to check if URL contains XML file or not?
我有一个项目是从 URL 获取 XML 文件,抓取它们,提取数据,然后处理它。此外,我正在使用用户输入创建 URL。但我需要检查 URL 是否包含要抓取的 XML 文件。任何想法如何做到这一点?那么基本上如何检查 URL 是否包含 XML 文件?
了解获取 URL 是否会检索 XML...
的方法
检索文件之前
- 有out-of-band保证。
- 检查
Content-Type
HTTP header 对 HEAD 请求的响应1.
检索文件后
- 检查响应的
Content-Type
HTTP header1.
- 嗅探根元素。
Files.probeContentType(path)
- 通过符合 XML 的解析器进行解析,没有出现任何 well-formedness 错误。
注意: 只有通过符合规范的 XML 解析器进行解析才能保证提供 100% 的确定性。
1 XML 数据的 MIME 分配:
application/xml
(RFC 7303,以前是 RFC 3023)
text/xml
(RFC 7303,以前是 RFC 3023)
- Other MIME assignments 用于 XML 个应用程序。
我有一个项目是从 URL 获取 XML 文件,抓取它们,提取数据,然后处理它。此外,我正在使用用户输入创建 URL。但我需要检查 URL 是否包含要抓取的 XML 文件。任何想法如何做到这一点?那么基本上如何检查 URL 是否包含 XML 文件?
了解获取 URL 是否会检索 XML...
的方法检索文件之前
- 有out-of-band保证。
- 检查
Content-Type
HTTP header 对 HEAD 请求的响应1.
检索文件后
- 检查响应的
Content-Type
HTTP header1. - 嗅探根元素。
Files.probeContentType(path)
- 通过符合 XML 的解析器进行解析,没有出现任何 well-formedness 错误。
注意: 只有通过符合规范的 XML 解析器进行解析才能保证提供 100% 的确定性。
1 XML 数据的 MIME 分配:
application/xml
(RFC 7303,以前是 RFC 3023)text/xml
(RFC 7303,以前是 RFC 3023)- Other MIME assignments 用于 XML 个应用程序。