EMR 5.16.0 - 启动了太多映射器

EMR 5.16.0 - Too many Mappers being launched

正在尝试将 EMR EC2 实例从 5.3 C4.4Xlarge(HIVE 版本 2.1.1)升级到 EMR 5.16.0 C5.4XLarge(Hive 2.3.3) 我在 2.1.1 EMR 5.3.0 中来自 table 的简单查询 select max(date) 仅启动 1 个映射器和 1 个缩减器,而当我升级和 运行 时,它正在启动相同的查询1300 多个映射器。

尝试比较两者的设置属性,发现没有区别。

有人可以帮我吗

试试下面的设置。在从配置单元 2.1.1 到 2.3.3 的某个地方,他们将其从 true 翻转为 false.

set hive.optimize.metadataonly=true;