首页
标签

parquet

合并 b/w 两个给出 MemoryError 的数据帧
云朵 impala PARQUET_FALLBACK_SCHEMA_RESOLUTION
使用 fastparquet 在子文件上划分镶木地板文件
pyarrow 可以像 fastparquet 的 file_scheme='hive' 选项一样将多个 parquet 文件写入一个文件夹吗？
使用 PyArrow 从 HDFS 读取镶木地板文件
使用 dask 将数据帧划分保存为镶木地板
将 pyarrow 与 libhdfs3 连接
hdfs.connect() 与 PyArrow 中的 HdfsClient
Spark 在读取镶木地板文件时出现问题
如何使用纯 Java（包括日期和小数类型）生成 Parquet 文件并上传到 S3 [Windows]（无 HDFS）
"not a Parquet file (too small)" 在 Spark 结构化流式传输期间来自 Presto 运行
在 spark 提交作业中读取镶木地板文件时出现内存不足错误
Impala 2.7 无法从使用 Tez 从 Hive 创建的镶木地板 table 中读取任何数据
使用 pyarrow 如何附加到镶木地板文件？
在没有 hadoop 的情况下，从 SQL 服务器中的表中提取 1 TB 数据到 Parquet 文件的更快方法是什么
AWS EMR 上的 Spark 2.2.0 写入 Parquet 会丢弃行
读取镶木地板文件时，Amazon Athena 未在数组中正确保留属性个结构名称
加载索引具有冗余列的镶木地板文件时出现pyarrow问题
EMR spark 步骤并将输出合并到一个文件中
编写镶木地板时出现 NullPointerException

1 2 ... 38 39 40 ... 53 54

©2023 WhoseBug