添加 python 包以用于 aws EMR 中的 spark

adding python packages for use in spark in aws EMR

我刚刚开始使用 AWS EMR 作为测试的一部分 - 我已经创建了一个引导文件来在我的 EMR 实例上使用 pip 安装特定的 python 包。我知道这是非常基本的事情。 bash 脚本包含

#!/bin/bash
set -e
pip install typing --user

但是,当我将 python 脚本作为一个步骤提交时,出现以下错误

Traceback (most recent call last): File "py-calculate.py", line 6, in from typing import Iterable ImportError: No module named typing End of LogType:stdout

从外观上看,尚未安装打字包。

如我所料,没有安装打字包。我以前的方法是修改bash脚本为

#! /bin/bash
sudo pip install -U typing

出于某种原因,这个效果更好。