与 Hadoop 堆栈中的 Impala 相比更快的技术?

Faster technologies compared to Impala in Hadoop stack?

已使用 Impala 超过 4 个月,我们发现在大多数情况下与 hive 相比,它的速度非常快。由于我们正在评估 Hadoop 中用于数据处理的快速框架,因此想知道它们是否在本地 Hadoop 环境中运行比 impala 更快的框架。(可以是任何类型,内存中或MR1 或基于纱线!)一个完整的列表会有所帮助。

Impala在速度方面是个不错的选择。对于标准 Map/Reduce 环境,您可能找不到更好的环境:impala 能够缓存数据块,并且比 M/R 快得多,即使是从磁盘读取未缓存的块也是如此。但是当然,鉴于您有几个月的 impala 经验 - 您已经知道了。据我所知,没有另一个使用本机 hadoop 结构的近乎实时的配置单元访问机制。