我知道 MapReduce 使用键值对。在这种情况下,关键和价值到底是什么?

I know that MapReduce uses key-value pairs. What exactly are the key and the value in this context?

在 MapReduce 中,我知道 Input Reader 翻译输入文件中的每条记录,并将解析后的数据以键值对的形式发送给映射器。但是,我不知道键和值到底代表什么。我已经阅读了很多资源,包括 Apache 的文档和 Tutorials Point 关于 MapReduce 的部分,但我仍然找不到它们是什么。

我有两个猜测:

1)键代表记录的标识符(如索引),值代表实际数据。

2)键表示集群中将处理该特定记录的节点,值表示该记录的数据。

我说的对吗?如果不是,请告诉我正确答案是什么。

我来说说 TextInputFormat,它是 mapreduce 的默认输入格式。

键是文件中的位置,值是文本行。

您可以随时参考 API 文档。https://hadoop.apache.org/docs/r2.7.5/api/org/apache/hadoop/mapred/TextInputFormat.html

对于任何输入格式的实现,您都可以在 API 文档中验证该输入格式使用的键和值是什么。在大多数情况下,键将是偏移量,值将是文件中的实际记录。