How to fix Jupyter notebook dependancies? ModuleNotFoundError: No module named 'boto3'

How to fix Jupyter notebook dependancies? ModuleNotFoundError: No module named 'boto3'

我是运行 EMR集群(AWS),但我不明白notebook是如何导入包的。我是 运行 PySpark 内核。

import boto3
No module named 'boto3'
Traceback (most recent call last):
ModuleNotFoundError: No module named 'boto3'

打印 (sys.version) 显示

3.7.6 (default, Feb 26 2020, 20:54:15) 
[GCC 7.3.1 20180712 (Red Hat 7.3.1-6)]

打印(sys.executable) 显示

/tmp/1594625399736-0/bin/python

我同时安装了 Conda 和 pip3 的 boto3。

如何解决?

sc.list_packages()

Package                    Version
-------------------------- -------
beautifulsoup4             4.9.0  
boto                       2.49.0 
cycler                     0.10.0 
jmespath                   0.9.5  
kiwisolver                 1.2.0  
lxml                       4.5.0  
matplotlib                 3.2.2  
mysqlclient                1.4.2  
nltk                       3.4.5  
nose                       1.3.4  
numpy                      1.19.0 
pandas                     1.0.5  
pip                        9.0.1  
py-dateutil                2.2    
py4j                       0.10.9 
pyparsing                  2.4.7  
pyspark                    3.0.0  
python-dateutil            2.8.1  
python37-sagemaker-pyspark 1.3.0  
pytz                       2020.1 
PyYAML                     5.3.1  
setuptools                 28.8.0 
six                        1.15.0 
soupsieve                  1.9.5  
wheel                      0.29.0 
windmill                   1.6

我有boto

您在使用 pyspark 吗?如果是,那么您需要在 spark 上下文中安装这些包。请参阅此 AWS 文档:https://aws.amazon.com/blogs/big-data/install-python-libraries-on-a-running-cluster-with-emr-notebooks/

如果您在导入时看到模块未找到错误,则同样安装任何依赖包。确保版本兼容。