在 DBFS 中的 Databricks 中保存来自 python-pptx 的 pptx

Saving pptx from python-pptx in Databricsk in DBFS

我正在尝试使用 python-pptx 包将 .pptx 文件保存到我的 Databricks 环境中的 DBFS,但收到以下错误:

[Errno 95] Operation not supported

当我 运行 prs.save('test.pptx') 它 运行 没有错误,但我不明白它的去向。

任何指导将不胜感激。这是 returns 上述错误的示例:


prs = Presentation()
title_slide_layout = prs.slide_layouts[0]
slide = prs.slides.add_slide(title_slide_layout)
title = slide.shapes.title
subtitle = slide.placeholders[1]

title.text = "Hello, World!"
subtitle.text = "python-pptx was here!"

prs.save('/dbfs/test.pptx')

这是由 DBFS Fuse limitations 引起的,具体来说,是缺少创建 PPTX 文件所需的随机写入支持。解决方案是将文件写入本地文件系统,写入后移动到DBFS:

prs.save('/tmp/test.pptx')
dbutils.fs.mv('file:///tmp/test.pptx', '/test.pptx')