关于 "Microformat vs HTML+RDFa" 收养的统计数据

Statistics about "Microformat vs HTML+RDFa" adoption

关于这些标准的“Web 使用”(使用一种或另一种标准的网页)是否有一些最近 和可靠的统计数据?

或者关于vCard(人and/or组织)使用范围的具体统计?

只有统计数据,这个问题不是关于“什么是最好的ideia?”或“如何使用它?”。寻找要比较的统计数字 Microformats adoption with (any kind of) RDFa in HTML adoption.

我们可以考虑,对于“计数页面”统计,Microdata 是一种 RDFa-HTML。


注意事项

解释上下文

RDFa Lite is the only W3C recommendation, when we talk about "Microdata vs Microformat", and Microdata have a better map to RDFa Lite. HTML5 has become a W3C Recommendation in 2014-10-28, and neither one was blessed by W3C. I understand that schema.org 是采用(重用社区模式)RDFa 的最佳方式。

另一方面 Microformats 比较老,也是最简单的;所以,也许是 Web 中使用最多的(!?是吗?)。

关于“vCard 数据统计”

如果我们需要一些 scope 的统计数据,让我们使用 vCard 作为 scope:

其他说明

维基百科表达了一个旧的(2012 年的)和不可证实的断言(没有来源!),“然而,hCard 等微格式在网络上的发布比架构和其他格式更多”。 =77=],而Webdatacommons一塌糊涂,没有统计报告。

(编辑)现在维基百科的引用错误已修复。


(在@sashoalm 评论后编辑) 不同意此问题有效的人请注意。

此问题是软件问题,不是“请求站外资源”...

问题:要决定项目中的库、框架、数据模型等,我们需要使用现在和未来几年正在使用的工具...要在软件开发中project decisions,我们需要有关用户趋势、框架采用等方面的统计数据

PS:在 Whosebug 中有很多关于语言统计的讨论,即 same“问题集”。示例:1, 2, 3,4, 5, 6. See also the questions tagged with [usage-statistics].

现在我明白了,有一些统计数据(!!),维基百科的 link 丢失了......我更正了。它未更新,来自“2013 年冬季”(~1.5 或 2 年前收集的数据),但显示现实和趋势。

http://webdatacommons.org/structureddata/index.html#toc2

这是报告中的图表(具有 RDFa+HTML 优势!):

口译:

  • 第 5 节,“提取过程”,在每一页上说 ”,我们 运行 我们的 RDF 提取器基于 Anything To Triples (Any23) 库“,因此所有(RDF 和微格式)都产生了“三元组”(不仅是 RDF)。

  • “每个域”统计的想法是域对所有页面使用统一的策略...但我认为这种统一是错误的,每个域只有少数页面采用“语义标记”.. .它不比URLs更不偏不倚,只是另外一张图而已。无论如何,结果是平局,~57% 对 43%。

  • 2013 年只有 21% 的“语义标记 URLs”是微格式,其他都是 RDFa-HTML (微数据也是RDFa的一种)

  • 使用域 (Ds) 和 URLs (Us), (Ds+Us)/2 的平均百分比,RDF 的结果是 ~60% 和 ~40微格式百分比。

  • 在 2013 年之前,微格式占据主导地位,因此,自 2011 年以来“RDFa-HTML”的大幅增长是显而易见的......趋势很明显。

  • 如果我们采用“每个域”和“每个 URL”计数的算术平均值,我们的微格式和 RDFa-HTML 彼此接近,但与稍微少一点微格式(以及 RDFa-HTML 在 2014 年增长的强烈趋势)。

这里是@sashoalm 讨论的table,显示百分比和总数


注意 1:HTML5 仅在 2014 年 10 月 28 日发布,因此只有 ~2015 年 10 月我们才能检查新标准对 Web 的真实(决定性)影响。一个重要的预期影响是 Microdata 没有受到 HTML5 的祝福,所以唯一的标准是 HTML+RDFa(推荐 RDFa Lite )... 未来微数据可能会更少,更多schema.org.

注 2:计算网页的方法问题,boilerplate text 带有一些巨大的克隆“语义标记”:我认为 “下一代”statiscs 可以使用一些“每个域分析”来制作 多样性 (语义标记页面)的 URL 子统计(抽样)。理想情况是对样板进行权衡(例如,计算一次非克隆并使用 1+SQRT(count) 个克隆)样板。

结论

今天也许有些人使用 Microformat,但 Web 中有更多页面使用 RDFa-HTML(微数据,RDFa,RDFa Lite等),并且有增长的趋势

如果你的项目是为明年做的,统计数据表明要使用 RDFa。


注意

RDFa 的另一个有趣计数不是使用,而是词汇表的重用 (!)。参见 Linked Open Vocabularies (LOV)

最后来自WebDataCommons的统计如下:

来源:http://webdatacommons.org/structureddata/2016-10/stats/stats.html

解析的域名数量:3400 万个付费域名
具有 RDFa、微数据和微格式的域数量:563 万 (16.5%)

不同格式的受欢迎程度: