允许内容的文本 table 和 HTML 5 个元素的内容类别

Text table of permitted content and content categories for HTML 5 elements

MDN HTML element reference 页面列出了关于每个元素的信息,包括:

是否有从中导出的结构化文本文件?或者包含等效信息?

我发现 appendix in the HTML 5 spec which lists categories and children (except for palpable content according to a well-hidden comment) and a later table 收集了一些 触手可及 的东西。这很好,但我不想尝试抓取供人类使用的数据。


我问是因为我有 some code 维护 ElementContainmentRelationships 是从规范的旧版本手工派生的。

我希望能够更轻松地跟踪规范,因此理想情况下,一些 HTML 相当于 UCD Property Files -- 用于机器处理的表格数据。

我知道关于解析的 HTML5 章有很多注意事项和特殊情况,但我正在寻找大部分正确的内容并跟踪规范。

MDN 参考资料是手工制作的。 CSS 数据最近被转换为机器可读格式(参见 https://github.com/mdn/data),团队愿意以这种格式提供更多 MDN 数据,但他们的资源有限,所以我不会不要让我抱有希望。

我不确定您是否知道 HTML 解析器的 Firefox/Gecko 实现是从 Java 实现 (The Validator.nu HTML parser) 转换而来的,它可能会有帮助,虽然快速浏览没有找到任何 tables 像你正在寻找的东西。

还有 RNG schemas for HTML5 作为同一验证器项目的一部分可用。