无法使用 dask 的 from_castra() 函数加载 castra 文件

Not able to load castra files with from_castra() function of dask

我正在尝试复制 this 页面关于 castra、dask 和 reddit 评论的示例,当我 运行

时出现上述错误

dd.from_castra(data,columns)

创建我的 castra 文件花了几个小时,但它很干净,与教程中提到的完全一样。

同时使用了我的 macbook 和亚马逊 AWS 上的一个 Ubuntu 实例,但遇到了同样的问题。

相同的代码和文件在 windows PC 上运行良好。

任何信息都可能有帮助!

ValueError: Expected iterable of tuples of (name, dtype), got ['archived', 'author',....]

Castra 是一个实验项目,不再受支持。请参阅自述文件 https://github.com/blaze/castra#maintenance

我找到了问题的解决方案。这是 版本 的问题。如果您遇到同样的问题,请执行以下操作:

步骤 1:

使用 pip 卸载 dask

pip uninstall dask

步骤 2:

使用 pip 卸载 castra

pip uninstall castra

步骤 3:

安装兼容castra的dask版本

pip install -Iv dask==0.10.0

步骤 4:

重新安装 castra

pip install castra

步骤 5:

安装正确的版本后,使用以下命令检查您的版本

pip show dask
pip show castra

版本应与屏幕截图中的版本相同:

terminal screen