"Hadoop distribution" 是什么意思

What is meaning of "Hadoop distribution"

我是 hadoop 新手。我最近阅读了有关 Apache Hadoop、Pig、Hive、HBase 的基础知识。 然后我遇到了术语 "Hadoop distribution",例子有 Cloudera、MAPR、HortonWorks。 那么 Apache Hadoop(及其回声系统)与 "Hadoop Distribution"

的关系是什么

是否像Java虚拟机规范(文档)和Oracle JVM、IBM JVM(文档的工作实现)? 但是我们从 Apache 获取 zip,这实际上是逻辑实现的。

所以我有点困惑。

基于Distributions and Commercial Support,以下公司提供的产品包括 Apache Hadoop、其衍生作品、商业支持、and/or 与 Hadoop 相关的工具和实用程序。

一些公司发布或销售的产品包括官方 Apache Hadoop 发布文件、and/or 他们自己的工具和其他有用的工具。其他公司或组织发布的产品包括从 Apache Hadoop 源代码树的修改或扩展版本构建的工件。此类衍生作品不受 Apache 团队支持:所有支持问题必须由供应商自行解决。

Since Hadoop is an open source project, a number of vendors have developed 
their own distributions, adding new functionality or improving the code base

供应商分发当然是为了克服开源版本的问题并为客户提供额外的价值,专注于诸如:

可靠性:供应商在检测到错误时反应更快。他们及时提供修复和补丁,使他们的解决方案更加稳定。

支持:多家公司提供技术支持,这使得采用该平台执行关键任务和企业级任务成为可能。

完整性: Hadoop 发行版经常辅以其他工具来解决特定任务。

查看此 top-hadoop-distributions article and this presentation 以了解三大 Hadoop 发行版之间的基准分析。