使用 RPM 在 CDH 5.* 上安装 Spark 2?
Installing Spark 2 on CDH 5.* with RPM?
我有一个从 RPM 包安装的 Cloudera CDH 5.11 集群(我们不想使用 Cloudera Manager 或包裹)。有人 found/built CDH 的 Spark 2 RPM 包吗? Cloudera 似乎只将 Spark 2 作为包裹运送。
你不会的。目前,文档“Spark 2 已知问题”明确指出:
Package Install is not Supported
The Cloudera Distribution of Apache Spark 2 is only installable as a parcel.
看来我无法对某个问题发表评论,所以请原谅 post 作为答案。
是否可以使用 CM 在 RPM 安装的集群上安装 Spark2 parcel?
最好的方法是使用 Spark on Yarn 而不是使用 Spark Master/Worker。您可以自由使用您喜欢的任何 Spark 版本,与供应商提供的版本无关。
您需要做的是打包 Spark History Server,以便能够在作业完成后查看它们。并且,如果要使用动态分配,则需要在 Yarn 中配置 Spark Shuffle Service。
从 CDH 6.0 开始,Spark 2 作为 RPM 包含在内。问题解决了。
我有一个从 RPM 包安装的 Cloudera CDH 5.11 集群(我们不想使用 Cloudera Manager 或包裹)。有人 found/built CDH 的 Spark 2 RPM 包吗? Cloudera 似乎只将 Spark 2 作为包裹运送。
你不会的。目前,文档“Spark 2 已知问题”明确指出:
Package Install is not Supported
The Cloudera Distribution of Apache Spark 2 is only installable as a parcel.
看来我无法对某个问题发表评论,所以请原谅 post 作为答案。
是否可以使用 CM 在 RPM 安装的集群上安装 Spark2 parcel?
最好的方法是使用 Spark on Yarn 而不是使用 Spark Master/Worker。您可以自由使用您喜欢的任何 Spark 版本,与供应商提供的版本无关。
您需要做的是打包 Spark History Server,以便能够在作业完成后查看它们。并且,如果要使用动态分配,则需要在 Yarn 中配置 Spark Shuffle Service。
从 CDH 6.0 开始,Spark 2 作为 RPM 包含在内。问题解决了。