首页
标签

fastparquet

fastparquet error when saving pandas df to parquet: AttributeError: module 'fastparquet.parquet_thrift' has no attribute 'SchemaElement
用于 Redshift 的 fastparquet 导出
如何追加到镶木地板文件以及它如何影响分区？
RuntimeError: Decompression 'SNAPPY' not available. Options: ['BROTLI', 'GZIP', 'UNCOMPRESSED'] (error happens only in .py and not in .ipython)
有没有办法增量更新 Dask 元数据文件？
是否可以使用 Dask 和 Fastparquet reader 读取手动分区的 Parquet 数据集？
将多个 CSV 转换为单个分区的镶木地板数据集
从 Python 写入嵌套镶木地板格式
Dask 数据帧从 http 读取镶木地板格式失败
是否可以在磁盘上存储镶木地板文件，同时追加并按索引检索行？
dask：从 Azure blob 中读取 parquet - AzureHttpError
Dask 不从简单（非 Hive）Parquet 文件中恢复分区
将数据从数据库移动到 Azure blob 存储
Read/Write 具有 Struct 列类型的 Parquet
读取大量镶木地板文件：read_parquet vs from_delayed
fastparquet 中的压缩选项不一致
加载多个镶木地板文件时保留 dask 数据帧划分
如何为使用 `dask.dataframe.to_parquet()` 创建的文件夹设置文件夹权限（mkdir 模式）？
使用 dask 高效地只读取 blob 存储上镶木地板文件中的某些列
为什么在 dask 中计算索引 Parquet 文件的形状如此缓慢？

1 2 3

©2023 WhoseBug