为链接数据目的识别网页主要内容的正确方法是什么?

What is the proper way to identify the main content of a web page for linked data purposes?

我在网站上工作,我想遵循链接数据的所有最佳做法。

我正在使用 JSON-LD 和 Schema.org 来提供有关页面内容的语义元数据,但似乎没有任何方法可以在页面上指定标签包含主要内容(而不是导航栏、页脚等)的内容。

该网站有多种内容类型(文章、视频、食谱等),我想让计算机能够轻松解析这些内容。正确的做法是什么?

您可以提供主要内容的实体,而不是说"the main content is in that HTML element"¹。

mainEntity property, you convey which are the primary entities on the WebPage。在这些实体中,您可以在合适的属性中提供它们的内容(取决于类型)。例如:


¹ mainContentOfPage property, which takes WebPageElement entities as value. But WebPageElement doesn’t allow you to point to an HTML element, you would still have to provide the actual content via suitable properties. Anyway, I recommend not to use mainContentOfPage (see my issue).

可能会出现类似的情况