AWS EMR:Zeppelin 从 python 2.7 获取 numpy 版本而不是更高版本
AWS EMR: Zeppelin taking numpy version from python 2.7 instead of higher version
我的 EMR (5.26.0) 集群上有 python 2.7(默认)和 python 3.6,下面是我的 bootstrap 脚本。我正在安装 numpy 版本 1.18.5
,我可以在 bootstrap 日志中看到它正在安装。然而,在 python3 包中,我看到它正在选择来自 Python 2.7 的 numpy 1.14.5
。如果您看到下面的屏幕截图,我可以看到版本 1.18.5
dist。 python packages 目录中的文件,但二进制文件用于但实际的 numpy 版本具有 1.14.5
.
的文件
我正在使用 zeppelin notebook 并通过设置以下变量更改了我的解释器 python 和 pyspark 属性以使用 python 3 但
PYSPARK_PYTHON = '/usr/bin/python3'
PYSPARK_DRIVER_PYTHON = '/usr/bin/python3'
# In zeppelin interpretor
zeppelin.pyspark.python='/usr/bin/python3'
#!/usr/bin/env bash
python3 -m pip uninstall botocore --user
python3 -m pip uninstall boto3 --user
sudo python3 -m pip install --upgrade pip
sudo python3 -m pip install botocore==1.13.38 --user
sudo python3 -m pip install h5py
sudo python3 -m pip install keras==2.3.0
sudo python3 -m pip install keras_applications==1.0.8 --no-deps
sudo python3 -m pip install keras_preprocessing==1.1.2 --no-deps
sudo python3 -m pip install tqdm
sudo python3 -m pip install s3fs
sudp python3 -m pip install ipaddress==1.0.23
sudo python3 -m pip install netaddr==0.7.19
sudo python3 -m pip install matplotlib
sudo python3 -m pip install pyarrow
sudo python3 -m pip install boto3
sudo python3 -m pip install torch==1.6.0
sudo python3 -m pip install --upgrade scipy==1.4.1
sudo python3 -m pip install torchvision
sudo python3 -m pip install pydot
sudo python3 -m pip install xlrd
sudo python3 -m pip install xlwt
sudo python3 -m pip install pandas
sudo python3 -m pip install scikit-learn
sudo python3 -m pip install scikit-multilearn
sudo python3 -m pip install wrapt==1.12.0
sudo python3 -m pip install tensorflow==2.3.0
sudo python3 -m pip install tensorflow-gpu==2.0.0
sudo python3 -m pip install numpy==1.18.5
此外,当我列出包时,我看到它列出 1.18.5
但是 numpy 版本命令显示 1.14.5
.
如何强制Python选择更高版本的numpy?
终于让它与 emr-5.31.0 及以下 bootstrap 配置一起工作,5.31+ 默认为 Python 3 和 numpy 1.16.5,即使 python 2 存在于环境。所以我得到了默认的更高版本的 numpy,它解决了我的交叉依赖问题。
sudo python3 -m pip install h5py==2.10.0
sudo python3 -m pip install keras==2.3.1
sudo python3 -m pip install keras_applications==1.0.8 --no-deps
sudo python3 -m pip install keras_preprocessing==1.1.0 --no-deps
sudo python3 -m pip install tqdm==4.40.0
sudo python3 -m pip install s3fs
sudo python3 -m pip install ipaddress==1.0.23
sudo python3 -m pip install netaddr==0.7.19
sudo python3 -m pip install matplotlib
sudo python3 -m pip install pyarrow==0.12.1
sudo python3 -m pip install boto3
sudo python3 -m pip install torch==1.6.0
sudo python3 -m pip install --upgrade scipy==1.4.1
sudo python3 -m pip install torchvision
sudo python3 -m pip install pydot==1.4.1
sudo python3 -m pip install xlrd
sudo python3 -m pip install xlwt
sudo python3 -m pip install pandas==1.2.0
sudo python3 -m pip install scikit-learn
sudo python3 -m pip install scikit-multilearn
sudo python3 -m pip install wrapt==1.12.0
sudo python3 -m pip install tensorboard==2.1.0
sudo python3 -m pip install tensorflow==2.1.0
sudo python3 -m pip install tensorflow-estimator==2.1.0
我的 EMR (5.26.0) 集群上有 python 2.7(默认)和 python 3.6,下面是我的 bootstrap 脚本。我正在安装 numpy 版本 1.18.5
,我可以在 bootstrap 日志中看到它正在安装。然而,在 python3 包中,我看到它正在选择来自 Python 2.7 的 numpy 1.14.5
。如果您看到下面的屏幕截图,我可以看到版本 1.18.5
dist。 python packages 目录中的文件,但二进制文件用于但实际的 numpy 版本具有 1.14.5
.
我正在使用 zeppelin notebook 并通过设置以下变量更改了我的解释器 python 和 pyspark 属性以使用 python 3 但
PYSPARK_PYTHON = '/usr/bin/python3'
PYSPARK_DRIVER_PYTHON = '/usr/bin/python3'
# In zeppelin interpretor
zeppelin.pyspark.python='/usr/bin/python3'
#!/usr/bin/env bash
python3 -m pip uninstall botocore --user
python3 -m pip uninstall boto3 --user
sudo python3 -m pip install --upgrade pip
sudo python3 -m pip install botocore==1.13.38 --user
sudo python3 -m pip install h5py
sudo python3 -m pip install keras==2.3.0
sudo python3 -m pip install keras_applications==1.0.8 --no-deps
sudo python3 -m pip install keras_preprocessing==1.1.2 --no-deps
sudo python3 -m pip install tqdm
sudo python3 -m pip install s3fs
sudp python3 -m pip install ipaddress==1.0.23
sudo python3 -m pip install netaddr==0.7.19
sudo python3 -m pip install matplotlib
sudo python3 -m pip install pyarrow
sudo python3 -m pip install boto3
sudo python3 -m pip install torch==1.6.0
sudo python3 -m pip install --upgrade scipy==1.4.1
sudo python3 -m pip install torchvision
sudo python3 -m pip install pydot
sudo python3 -m pip install xlrd
sudo python3 -m pip install xlwt
sudo python3 -m pip install pandas
sudo python3 -m pip install scikit-learn
sudo python3 -m pip install scikit-multilearn
sudo python3 -m pip install wrapt==1.12.0
sudo python3 -m pip install tensorflow==2.3.0
sudo python3 -m pip install tensorflow-gpu==2.0.0
sudo python3 -m pip install numpy==1.18.5
此外,当我列出包时,我看到它列出 1.18.5
但是 numpy 版本命令显示 1.14.5
.
如何强制Python选择更高版本的numpy?
终于让它与 emr-5.31.0 及以下 bootstrap 配置一起工作,5.31+ 默认为 Python 3 和 numpy 1.16.5,即使 python 2 存在于环境。所以我得到了默认的更高版本的 numpy,它解决了我的交叉依赖问题。
sudo python3 -m pip install h5py==2.10.0
sudo python3 -m pip install keras==2.3.1
sudo python3 -m pip install keras_applications==1.0.8 --no-deps
sudo python3 -m pip install keras_preprocessing==1.1.0 --no-deps
sudo python3 -m pip install tqdm==4.40.0
sudo python3 -m pip install s3fs
sudo python3 -m pip install ipaddress==1.0.23
sudo python3 -m pip install netaddr==0.7.19
sudo python3 -m pip install matplotlib
sudo python3 -m pip install pyarrow==0.12.1
sudo python3 -m pip install boto3
sudo python3 -m pip install torch==1.6.0
sudo python3 -m pip install --upgrade scipy==1.4.1
sudo python3 -m pip install torchvision
sudo python3 -m pip install pydot==1.4.1
sudo python3 -m pip install xlrd
sudo python3 -m pip install xlwt
sudo python3 -m pip install pandas==1.2.0
sudo python3 -m pip install scikit-learn
sudo python3 -m pip install scikit-multilearn
sudo python3 -m pip install wrapt==1.12.0
sudo python3 -m pip install tensorboard==2.1.0
sudo python3 -m pip install tensorflow==2.1.0
sudo python3 -m pip install tensorflow-estimator==2.1.0