<figure> 元素的用途是什么?

What is the purpose of the <figure> element?

我一直在努力理解 <figure> 元素;从 w3.org:

看看这个

Self-contained in this context does not necessarily mean independent. For example,each sentence in a paragraph is self-contained; an image that is part of a sentence would be inappropriate for figure, but an entire sentence made of images would be fitting.

图像如何成为句子的一部分?这是在说什么?我已经阅读了很多解释,但我不明白为什么我要使用这个元素。这个标签的用途是什么?

根据MDN

Usually a <figure> is an image, illustration, diagram, code snippet, etc., that is referenced in the main flow of a document, but that can be moved to another part of the document or to an appendix without affecting the main flow.

这方面的一个示例(基于同一 MDN link 中的一个示例)可能是一个代码片段,它在一篇关于该属性的文章中打印浏览器导航器的部分。您不需要知道打印该信息的确切代码来理解 navigator 中的内容,但它可以帮助 reader 的理解。

此外,<figure> 标签允许将 <figcaption> 标签用作子标签,这是一种方便易用的图片说明方式。

HTML5 语义标签对每个人来说都是神秘的。由于这些概念有意保持抽象和科学,我将使用一堆 over-simplification 使其易于理解,尽管 HTML5 专家告诉我我错了。

请记住,创建语义标签是为了让 计算机而非人类阅读。它们的存在是为了 google 的脚本(以及每个人的脚本,但主要是 google 和黑客机器人)可以快速搜索图形并为其编制索引。要理解语义标签,请像脚本一样思考,而不是像人一样思考。

"If I was a bot programmed by a hacker, how would I mine figures when crawling my website?"

如果我们编写一个脚本来查找 IMG 标签,它最终会收集一堆垃圾(即图标)。我们感兴趣的是真实内容,这就是“self-contained content”的意思:您从您的网站剪切并粘贴此元素到我在您的 HTML,很有用。

垃圾: 图标、装饰图片、javascript 插件创建的美化图片、笑脸等

好发现: 图表、照片、图表、地图、绘图等

Good finds”是有意义的,即使您在没有任何上下文的情况下从您的网页中窃取它们,除了伴随的 "caption" 标签之类的东西。这些标签允许爬虫将您的图片与文本标签相关联,使分类更容易所以您不想错过此内容

所以我们对图形标题、标题、副标题等感兴趣,图形应该包含所有这些。 figure 标签不仅限于图像;它可以包含文本、视频、音频、代码块,只要它是文档中 "entity" 的一部分即可。所以下面是单图:

现在,在科学论文等文档中,您经常会发现这样的内容:

虽然每张图片本身都有意义,但它们作为一个整体更有意义,因为它们通过某种关系联系在一起;有时甚至顺序也很重要(即一系列步骤,或某事经过的状态照片)。那是“句子的数字”,你想把它们一起挖掘,否则你会丢失有价值的信息。

我们的挖掘算法必须使用某种 natural-language-processing AI 来理解您网站的内容,或者它可能只收集您为其提供的 FIGURE 标签。后者语义好

总结一下,假设您是代码中的 Google AI 算法挖掘数字。写下你的图形标签,使这个脚本的工作变得简单。