如何在 Databricks 中使用 bamboolib?

How can I use bamboolib in Databricks?

我想使用 Azure Databricks 自动进行探索性数据分析,我已经看到了它的潜力,例如 post:https://towardsdatascience.com/the-easy-way-to-do-data-exploration-22b4b8e1dc20

但是当在 Databricks 中执行相同的步骤时,扩展未启用。我测试过这样的东西:

import bamboolib as bam
import pandas as pd

同时测试添加以下行以启用扩展:

bam.enable()

# Jupyter Notebook extensions
!python -m bamboolib install_nbextensions

我还了解到 bamboolib 正在与 Databricks“联手”,但仍然找不到它是否尚不可用或有关此集成的任何文档。

如果有人知道如何将 bamboolib 与 Databricks 一起使用,我将不胜感激

您可以使用以下两种方法安装 bamboolib 库。

  1. pip install bamboolib - link

  1. 在 databricks 集群中安装库。

您可以参考 Rahul Agarwal 的 article

我在 Databricks 的团队中从事 bamboolib 集成工作,我很高兴你想试用 bamboolib。

更新:自 2022 年 6 月 3 日起,bamboolib 在 Databricks notebooks 中提供私人预览版。如果您想获得访问权限,请联系您的 Databricks 客户团队,他们应该能够在 1 天内为您提供访问权限。