hdfs.connect() 与 PyArrow 中的 HdfsClient

hdfs.connect() vs HdfsClient in PyArrow

如果这是一个菜鸟问题,我深表歉意,但我找不到任何相关参考 -

这两者有什么区别?

如果我想使用 pyarrow 从 hdfs 读取 parquet 文件,我会使用哪个?

HdfsClient API 已弃用,您想现在使用 pyarrow.hdfs.connect 连接:http://arrow.apache.org/docs/python/filesystems.html#hadoop-file-system-hdfs