PageRankBenchmark - 减少 0% - Giraph 示例

PageRankBenchmark - Reduce at 0% - Giraph example

我正在使用 PageRankBenchmark 示例测试我的单节点集群 Giraph 安装,方法如下:

$HADOOP_HOME/bin/hadoop jar   /usr/local/hadoop/share/hadoop/mapreduce/giraph-examples-1.1.0-for-hadoop-2.4.0-jar-with-dependencies.jar org.apache.giraph.benchmark.PageRankBenchmark -v -V 1000 -e 1 -s 5 -w 1

但是在映射器完成他们的工作后,reducer 不会启动(映射 100% 减少 0%,根据控制台)。这是该算法的适当行为吗?

如果执行映射器,则缩减器必须开始将映射的输出作为输入并完成工作(至少,在互联网上的许多其他 PageRank 算法实现中,总是有 "Reducer").但是我 google 它,并且总是 PageRankBenchmark giraph 示例在该算法的几个结果中以 Reduce at 0% 结尾,其他人运行。

所以,我现在不知道在 PageRankBenchmark 中是否可以,我希望有人可以在这里帮助我 ;)

我正在使用 hadoop 2.4,具有 Phadoop_yarn 配置文件和 Giraph 1.1.0。

根据我读到的其他几个问题,"Reduce 0% stuck" 问题的主要问题可能在映射器日志中,但我在那里找不到任何东西(我也附上了它们)。

这是我的日志:

干杯!

Giraph 遵循纯地图范式。换句话说,每个工人都与一个地图任务相关联。所有的计算都是在地图任务中执行的,地图任务之间为了发送/接收消息而进行的通信是通过使用动物园管理员完成的。因此,它不同于传统的 map-reduce 编程范例,后者将 map 输出传输到 reducer。因此,没有reduce任务,也没有map输出。