典型的 Hadoop 架构和 MapR 架构之间的区别

Difference Between typical Hadoop Architecture and MapR architecture

我知道Hadoop是基于Master/Slave架构的

HDFS 适用于 NameNodesDataNodes

MapReduce 适用于 jobtrackersTasktrackers

但是我在 MapR 上找不到所有这些服务,我发现它有自己的架构和自己的服务

我有点困惑,谁能告诉我只使用 Hadoop 和使用 MapR 有什么区别!

您必须参考 Hadoop 2.x 最新架构,因为 YARN(Yet Another Resource Negotiator)和 High Availability 已在 2.x 版本中引入。

作业跟踪器和任务跟踪器替换为资源管理器、节点管理器和应用程序管理器

Hadoop 2.x YARN & High Availability

MapR架构,参考MapR文章

不同经销商之间的比较,参考这张图

Bill Vorhies

Data-magnum 文章提供了详细比较

Mapr 使用大多数 Apache 大数据发行版作为它们的基准。 Mapr 是一个 hadoop(和大数据技术堆栈)分发提供商,为其客户提供某些附加组件和技术支持。

强调 mapr 与 apache hadoop 完全在同一架构上,包括所有核心库分布。然而,mapr 分发更像是一个完整且兼容的大数据技术包的捆绑包。

mapr 的主要优点是它分布的各种技术(如 hive、hbase、spark 等)将与核心 hadoop 兼容并相互兼容。这一点我特别重要,因为大数据技术正在以不同的速度发展,因此新闻发布很快就会变得不兼容。

因此,mapr、cloudera 等供应商正在提供他们的 hadoop 版本分发和支持,以便最终用户可以专注于产品构建,而不必担心兼容性问题。但几乎所有人都在暗中使用 apache 发行版。

将来,他们可能会提出某些变体和附加功能,以试图防止客户转向其他供应商,但目前情况并非如此。

MapR 和 apache Hadoop 在存储级别上没有相同的架构。 MapR 使用自己的文件系统 MaRFS,它在概念和实现方面与 HDFS 完全不同。你可以在这里找到更详细的比较:https://www.mapr.com/blog/comparing-mapr-fs-and-hdfs-nfs-and-snapshots#.VfGwwxG6eUk https://www.mapr.com/resources/videos/comparison-mapr-fs-and-hdfs