SAP HANA 智能数据访问与 SAP HANA Vora 之间的区别

Difference between SAP HANA Smart Data Access & SAP HANA Vora

谁能解释一下 SAP HANA 的 智能数据访问SAP HANA Vora 之间的区别?

据我了解,SDA 只是创建了一些 virtual tables 可以访问外部系统(如 Hadoop 和 ODBC 的许多其他数据库)的数据,例如它将成为 SAP HANA 系统的一部分(因此您可以使用 HANA IDE)并使用 "default database engine" 计算并将此外部系统的子结果 return 返回给 SAP HANA .

Vora的概念也是让SAP用户访问Hadoop系统,但是子结果是使用Apache Spark的InMemory执行引擎计算的。

我读到 Hadoop 是冷数据的完美数据存储(来自 SAP HANA 的数据早于特定时间段并且并非所有分析都需要)。但是我对这两种数据访问解决方案感到困惑,因为我找不到重要的区别。

如果您计划在一次分析中访问由 SAP HANA 工具编写的热 (SAP HANA) 和冷 (Hadoop) 数据,哪个更好?

将 SAP HANA 与包含 Hive 表中数据的 Hadoop 集群相结合,您有何建议?

HANA Vora 和 SDA 是相关的,但实际上是两个不同的东西,不能直接比较。

智能数据访问是 HANA 中的一个 feature/component,用于连接到外部数据源(例如 MySQL/Oracle 数据库、Vora 等)

"HANA Vora" 中的 HANA 一词具有误导性,因为 Vora 实际上是一个独立的产品,不需要 HANA 运行。 Vora 是 Apache Spark 的扩展,允许您在内存中处理来自 HDFS 的数据。此外,Vora 的一个关键特性是它可以与 HANA 很好地集成。它可以将本地表与来自 HANA 的表连接起来,反之亦然。

目前Vora不支持INSERT/UPDATE命令,因此您不能直接将用于冷数据存储的数据从HANA移动到Vora。但是,您可以使用 HANA 的数据生命周期管理器 (DLM) 来实现这一点,这篇博文中对此进行了讨论:https://blogs.sap.com/2016/02/12/seamless-big-data-tiering-with-hana-hadoop-and-vora-with-a-little-help-from-dlm/