使用工作区 api 导入方法导入数据块笔记本(动态内容)

Import databricks notebook (dynamic content) using workspace api import method

我想使用工作区 api 导入方法导入数据块笔记本。笔记本的内容应该是动态的。我正在尝试使用以下代码,但出现错误:

malfunctioned request

请求包含无效的 json 正文。我已经尝试将 content 转换为 base64 编码数据并将其传递到有效载荷中,但它仍然给出相同的错误。我想实现的主要目的是,我想动态生成笔记本的内容。

import requests
import os
import json

ctx = json.loads(dbutils.notebook.entry_point.getDbutils().notebook().getContext().toJson())
host_name = ctx['extraContext']['api_url']
host_token = ctx['extraContext']['api_token']
notebook_path = ctx['extraContext']['notebook_path']
new_path = os.path.join(os.path.dirname(notebook_path), 'New name')

data = {
  "content": "print(hellow world)",
  "path": new_path,
  "language": "PYTHON",
  "overwrite": true,
  "format": "SOURCE"
}

response = requests.post(
    '{host_name}/api/2.0/workspace/import',
    headers={'Authorization': f'Bearer {host_token}'},
    data = data
  ).json()

这里有几个问题:

  • per documentationcontent 字段应该是 base64 编码的,所以你需要这样做:
import base64
data = {
  "content": base64.b64encode("print(hellow world)".encode()),
  ...
}
  • 有效负载应该是 JSON,但您使用的 data 参数将数据作为多部分表单数据发送(请参阅 docs)。您需要改用 json 参数:
response = requests.post(
    f'{host_name}/api/2.0/workspace/import',
    headers={'Authorization': f'Bearer {host_token}'},
    json = data
  ).json()
  • 您正在尝试替换主机名,但您使用的只是字符串,而不是 f 字符串,因此您需要将 '{host_name}/api/2.0/workspace/import' 更改为 f'{host_name}/api/2.0/workspace/import'