如何在数据块上 运行 python3?

How to run python3 on databricks?

我尝试 运行 我在数据块(社区版)上的机器学习代码,需要使用 Orange3 数据挖掘库。但是,当我尝试创建 orange3 库时,它给出了这样的错误:

Error: java.lang.RuntimeException: Installation failed with message: Collecting orange3 Downloading Orange3-3.8.0.tar.gz (34.0MB) Complete output from command python setup.py egg_info: Orange requires Python >= 3.4 ---------------------------------------- mesg: ttyname failed: Inappropriate ioctl for device Command "python setup.py egg_info" failed with error code 1 in /tmp/pip-build-DnpIcU/orange3/

我想这意味着我需要 python3 来安装库,但 databricks 上的默认版本是 python2。我想知道如何将它更改为 python3。

我还在 databricks 论坛上搜索并找到了这个 post(https://docs.databricks.com/api/latest/examples.html#create-a-python-3-cluster)。

但是,我还是不太明白如何创建 python3-cluster。是不是说我需要用ClusterAPI来定制一个集群,需要额外收费?

感谢任何帮助!!

Python 3 现在是创建集群时的默认值,并且有一个 UI 下拉菜单可以在较早的 运行 时间在 2 或 3 之间切换。 Databricks Runtime 6+ 将不再支持 2。

docs 提供了有关各种 Python 设置的更多详细信息。

关于具体版本,这取决于您使用的运行时。

例如:

  • 5.5 LTS 运行s Python 3.5
  • 5.5 LTS ML 运行s Python 3.6
  • 5.5 与 Conda 运行s Python 3.7
  • 6.0 和 6.1 都是 运行3.7