为链接数据目的识别网页主要内容的正确方法是什么?
What is the proper way to identify the main content of a web page for linked data purposes?
我在网站上工作,我想遵循链接数据的所有最佳做法。
我正在使用 JSON-LD 和 Schema.org 来提供有关页面内容的语义元数据,但似乎没有任何方法可以在页面上指定标签包含主要内容(而不是导航栏、页脚等)的内容。
该网站有多种内容类型(文章、视频、食谱等),我想让计算机能够轻松解析这些内容。正确的做法是什么?
您可以提供是主要内容的实体,而不是说"the main content is in that HTML element"¹。
同mainEntity
property, you convey which are the primary entities on the WebPage
。在这些实体中,您可以在合适的属性中提供它们的内容(取决于类型)。例如:
如果是 Article
, you can provide the article body in the articleBody
property。
如果是ImageObject
, you can provide the image’s URL in the contentUrl
property.
…
¹ mainContentOfPage
property, which takes WebPageElement
entities as value. But WebPageElement
doesn’t allow you to point to an HTML element, you would still have to provide the actual content via suitable properties. Anyway, I recommend not to use mainContentOfPage
(see my issue).
可能会出现类似的情况
我在网站上工作,我想遵循链接数据的所有最佳做法。
我正在使用 JSON-LD 和 Schema.org 来提供有关页面内容的语义元数据,但似乎没有任何方法可以在页面上指定标签包含主要内容(而不是导航栏、页脚等)的内容。
该网站有多种内容类型(文章、视频、食谱等),我想让计算机能够轻松解析这些内容。正确的做法是什么?
您可以提供是主要内容的实体,而不是说"the main content is in that HTML element"¹。
同mainEntity
property, you convey which are the primary entities on the WebPage
。在这些实体中,您可以在合适的属性中提供它们的内容(取决于类型)。例如:
如果是
Article
, you can provide the article body in thearticleBody
property。如果是
ImageObject
, you can provide the image’s URL in thecontentUrl
property.…
¹ mainContentOfPage
property, which takes WebPageElement
entities as value. But WebPageElement
doesn’t allow you to point to an HTML element, you would still have to provide the actual content via suitable properties. Anyway, I recommend not to use mainContentOfPage
(see my issue).