使用 CLI and/or API 执行 git pull on databricks notebook

Execute git pull on databricks notebook using CLI and/or API

使用 Databricks Repos,您可以将 git 存储库添加到 Databricks 并执行 git 操作,例如 git pull。这是通过单击左上角的分支名称,然后单击“拉”按钮来完成的。

我想在不单击浏览器中的内容的情况下执行此操作。

我假设两者都是可能的( 暗示是这样),但只提供一个就足以回答我的问题。


有人可能想知道,如果拉动非常重要,我期望发生什么,例如。分支已经分叉,或者“你的未暂存的更改将被拉动......消除”。在这种情况下,简单地出错就足够了。我打算通过其他机制确保它永远不会发生。

对于 databricks-cli,它是 databricks repos update 命令:

>databricks repos update -h     
Usage: databricks repos update [OPTIONS]

  Checks out the repo to the given branch or tag. This call returns an error
  if the branch  or tag doesn't exist.

Options:
  --repo-id TEXT  Repo ID
  --path TEXT     Workspace path of the repo object
  --branch TEXT   Branch name
  --tag TEXT      Tag name

即使回购在给定分支上,它也会检查分支:

databricks repos update --path /Repos/.... --branch releases

您可以在显示 Repos 与 Azure DevOps 集成的 following repository 中找到它的工作演示。

对于 REST API,有相同演示存储库的 corresponding endpoint. The only difference from CLI is that it accepts only Repository ID, not the path, but you can find Repos ID from path via Get Status endpoint of Workspace API. You can find an example in the history(请注意,Repos API 可能会从那时起发生变化)