How to fix Jupyter notebook dependancies? ModuleNotFoundError: No module named 'boto3'
How to fix Jupyter notebook dependancies? ModuleNotFoundError: No module named 'boto3'
我是运行 EMR集群(AWS),但我不明白notebook是如何导入包的。我是 运行 PySpark 内核。
import boto3
No module named 'boto3'
Traceback (most recent call last):
ModuleNotFoundError: No module named 'boto3'
打印 (sys.version) 显示
3.7.6 (default, Feb 26 2020, 20:54:15)
[GCC 7.3.1 20180712 (Red Hat 7.3.1-6)]
打印(sys.executable) 显示
/tmp/1594625399736-0/bin/python
我同时安装了 Conda 和 pip3 的 boto3。
如何解决?
sc.list_packages()
Package Version
-------------------------- -------
beautifulsoup4 4.9.0
boto 2.49.0
cycler 0.10.0
jmespath 0.9.5
kiwisolver 1.2.0
lxml 4.5.0
matplotlib 3.2.2
mysqlclient 1.4.2
nltk 3.4.5
nose 1.3.4
numpy 1.19.0
pandas 1.0.5
pip 9.0.1
py-dateutil 2.2
py4j 0.10.9
pyparsing 2.4.7
pyspark 3.0.0
python-dateutil 2.8.1
python37-sagemaker-pyspark 1.3.0
pytz 2020.1
PyYAML 5.3.1
setuptools 28.8.0
six 1.15.0
soupsieve 1.9.5
wheel 0.29.0
windmill 1.6
我有boto
您在使用 pyspark 吗?如果是,那么您需要在 spark 上下文中安装这些包。请参阅此 AWS 文档:https://aws.amazon.com/blogs/big-data/install-python-libraries-on-a-running-cluster-with-emr-notebooks/
如果您在导入时看到模块未找到错误,则同样安装任何依赖包。确保版本兼容。
我是运行 EMR集群(AWS),但我不明白notebook是如何导入包的。我是 运行 PySpark 内核。
import boto3
No module named 'boto3'
Traceback (most recent call last):
ModuleNotFoundError: No module named 'boto3'
打印 (sys.version) 显示
3.7.6 (default, Feb 26 2020, 20:54:15)
[GCC 7.3.1 20180712 (Red Hat 7.3.1-6)]
打印(sys.executable) 显示
/tmp/1594625399736-0/bin/python
我同时安装了 Conda 和 pip3 的 boto3。
如何解决?
sc.list_packages()
Package Version
-------------------------- -------
beautifulsoup4 4.9.0
boto 2.49.0
cycler 0.10.0
jmespath 0.9.5
kiwisolver 1.2.0
lxml 4.5.0
matplotlib 3.2.2
mysqlclient 1.4.2
nltk 3.4.5
nose 1.3.4
numpy 1.19.0
pandas 1.0.5
pip 9.0.1
py-dateutil 2.2
py4j 0.10.9
pyparsing 2.4.7
pyspark 3.0.0
python-dateutil 2.8.1
python37-sagemaker-pyspark 1.3.0
pytz 2020.1
PyYAML 5.3.1
setuptools 28.8.0
six 1.15.0
soupsieve 1.9.5
wheel 0.29.0
windmill 1.6
我有boto
您在使用 pyspark 吗?如果是,那么您需要在 spark 上下文中安装这些包。请参阅此 AWS 文档:https://aws.amazon.com/blogs/big-data/install-python-libraries-on-a-running-cluster-with-emr-notebooks/
如果您在导入时看到模块未找到错误,则同样安装任何依赖包。确保版本兼容。