结构化数据标记还有多远?

How far to go with Structured Data Markup?

我越深入结构化数据构成,它似乎变得越复杂和详细。甚至可以标记页面的区域,如页脚、页眉、侧边栏、单个菜单元素等,我猜如果过于认真,一个页面很容易包含 80% 的模式标记和 20% 的内容。 :)

向一个网站的可能有数百个实际内容页面添加超过一个粗略的标记框架(WebPageArticle)真的有什么用吗,而且不应该只添加一个在专门的 contact/business 信息页面上包含完整的作者信息以及营业时间、联系方式等?我担心腹胀。对于某些类型的页面,建议使用哪种标记,以及可以忽略哪种标记,因为搜索引擎无论如何都会从网站的其他部分编译信息?

如果您只关心大型搜索引擎服务中用户可见的搜索结果功能(例如,BingGoogle SearchYahoo!SearchYandex,它们都恰好赞助了 Schema.org),答案很简单: 提供要识别的搜索引擎文档。

这些用户可见的搜索结果功能是搜索引擎 "do" 具有 Schema.org 结构化数据的唯一特征吗?可能不会。他们可能会使用结构化数据来更好地理解页面内容,并且很可能会分析他们将来可以提供的其他功能。参见示例 Dan Brickley’s (he is Google’s Schema.org representative) posting about this。但是,当然,所有这些通常都不会被搜索引擎记录下来。因此,如果您也关心这一点,答案将是:提供对搜索引擎有用的内容。

搜索引擎是唯一对 Schema.org 结构化数据感兴趣的消费者吗?不,还有无数其他消费者(服务和工具)。进入 Semantic Web and Linked Data 的世界。如果您了解并关心消费者,答案又很简单:提供该消费者文档支持的内容。但当然,你不可能全部都知道。因此,如果您关心所有这些(已知的和未知的,当前存在的和仍将出现的)消费者,答案将是:提供对所有消费者有用的内容。 或者,因为这些消费者的兴趣差异很大,甚至:尽你所能。


也就是说,肯定有 Schema.org 类型很少提供。一个很好的例子是 WebPageElement types, which, as you mentioned, can get used for page areas (header, footer, navigation, sidebar etc.). In my opinion, .

如果您关心文件大小,you’ll want to 使用 Microdata/RDFa(因为这些语法允许您注释现有内容)而不是 JSON-LD(因为此语法要求您复制内容)。使用 RDFa,与 Microdata 相比,您甚至可能会节省更多。
但是,结构化数据通常只占 markup/content 的一小部分,即使您提供尽可能多的数据也是如此。

与其在每个页面上重复 "background information"(例如,有关业务的完整数据),您可以使用参考资料:您 define a URI for your business (or every other thing) on the page where you fully describe it, and use this URI as property value where applicable on other pages. This is possible with @id (JSON-LD, see an example)、itemid(微数据), 和 resource (RDFa)。不这样做的唯一原因可能是缺乏消费者对此类参考的支持(取决于消费者/用例,他们可能不会被遵循)。中间方法可能是在每个页面上提供项目(关于业务或任何其他事物),一次提供完整数据,而在所有其他情况下提供有限的数据集(理想情况下是页面上可见的内容,或者什么特定消费者需要)。 URI 用作每个项目的标识符,表示所有这些项目都差不多。