使用 install_github 安装 SparkR 包时出错

Error while installing SparkR package using install_github

我正在尝试在 R 中使用 SparkR 包。我有所有依赖包,如 devtoolsRtools.exe

当我尝试以下命令时:

install_github("amplab-extras/SparkR-pkg",subdir="pkg")

我收到以下错误:

Downloading github repo amplab-extras/SparkR-pkg@master
Error in function (type, msg, asError = TRUE ) :
  Received HTTP code 403 from proxy after CONNECT

为了解决这个问题,我设置了一个有效的 http_proxy、https_proxy,但它不起作用并抛出上述错误。我是 R/RStudio.

的新手

我已经在 Windows 7、64 位 R-3 上安装了 SparkR。2.x 并在其上安装了 Spark 1.4。

** 如果您需要了解如何在 Windows 上安装 Spark,请查看 Spark 的官方文档或列出的逐步过程 here.

  • 进入maven的bin文件夹

    C:\Program Files\apache-maven-3.3.3\bin

  • 打开记事本并粘贴文本

    "%~dp0\mvn.cmd" %*

  • 将bin文件夹中的记事本保存为mvn.bat如下图

    C:\Program Files\apache-maven-3.3.3\bin\mvn.bat

  • 重启Rstudio并执行

    library(devtools) install_github("repo/SparkR-pkg", ref="branchname", subdir="pkg")

自从 2015 年 6 月 1.4 版本开始将 SparkR 合并到 Spark Core 项目中以来,现在 SparkR 构建指令与 Spark 构建指令相同。确保为 SparkR 添加 Maven 标志 -Psparkr。

例如,您可以使用 SparkR 构建一个 Spark 版本,如下所示:

build/mvn -Psparkr -DskipTests clean package

详情请见:http://spark.apache.org/docs/latest/building-spark.html.