如何下载特定cloudera发行版的源代码?

how to download source code for a specific cloudera distribution?

Whosebug 的好心人帮我弄清楚了如何在我的 ubuntu 开发机器上识别特定的 cloudera 版本。 ( dpkg -l | grep cdh ).

现在我想摸索一下资源,但我不知道去哪里下载它们。假设我想下载 hdfs 源(使用 cdh5.3.0 的 cloudera mods):

dpkg显示的版本是:

hadoop-hdfs 2.5.0+cdh5.3.0+781-1.cdh5.3.0.p0.54~精确

现在,如果我转到这个 github 存储库:https://github.com/cloudera/hadoop-hdfs 我没有看到任何包含字符串“5.3.0”的标签。

所以我不知道该去哪里看。任何指点将不胜感激。

您有两种下载cloudera 版本特定源代码的选项。

选项 1:来自 Maven 存储库

https://repository.cloudera.com/artifactory/cloudera-repos/org/apache/hadoop/hadoop-hdfs/2.5.0-cdh5.3.0/hadoop-hdfs-2.5.0-cdh5.3.0-sources.jar

https://repository.cloudera.com/artifactory/cloudera-repos/org/apache/hadoop/hadoop-common/2.5.0-cdh5.3.0/hadoop-common-2.5.0-cdh5.3.0-sources.jar

(适当更改版本和 hadoop 组件名称)

选项 2:来自 tar ball repo

Cloudera 以 tar 球 (hadoop-x.x.x.tar.gz) 的形式提供 Hadoop 版本,这将包含二进制文件和源代码。以下 Cloudera 存储库中提供了相同的内容。

http://archive.cloudera.com/cdh5/cdh/5/hadoop-2.5.0-cdh5.3.0.tar.gz