我是否必须安装 Hadoop 才能使用 Elasticsearch ES-Hadoop 连接器

Do I have to install Hadoop in order to use Elasticsearch ES-Hadoop connector

我有 Elasticsaerch 个集群,想在其上使用 Apache Spark 到 运行 计算。 The ES-Hadoop connector 包含一个 Spark 库,可以在 Elasticsearch 上进行 运行 计算。我必须先安装 Hadoop 还是我可以像文档中提到的那样将 elasticsearch-spark_2.10-2.2.0-rc1.jar 放在 Spark 类路径中以使其工作?

如果您想将 ElasticSearch 与 Spark 一起使用,那么我建议您使用 Elasticsearch 的 Spark Native Support。

使用起来更方便,可以直接laod/save数据to/from Elasticsearch as Spark RDD。详情请参考:Elasticsearch Apache Spark support