首页
标签

parquet

Spark 2.2 无法将 df 写入镶木地板
Impala：如何查询具有不同模式的多个镶木地板文件
使用 pyarrow vs pyspark 创建的镶木地板文件是否兼容？
在 Pyarrows 的 HdfsClient 中使用多处理
在行组大小小于 100 的 spark 中创建镶木地板文件
构建 parquet-cpp 时如何静态 link 箭头？
结构化流式传输性能和清除 parquet 文件
羽毛和镶木地板有什么区别？
如何将带有小数字段的镶木地板文件加载到 BigQuery 中？
为什么 Zeppelin 在 %spark.sql 段落中以 "mismatched input ';' expecting <EOF>" 失败？
为什么在写入镶木地板时流式查询失败并显示 "InvalidSchemaException: A group type can not be empty (...) Empty group: spark_schema"？
AttributeError: LooseVersion instance has no attribute 'version'
使用 pyarrow 从分区镶木地板数据集中读取特定分区
从 Flink 1.3.2 升级到 1.4.0 hadoop 文件系统和路径问题
Spark read.parquet 花费太多时间
将日期时间与 Pyarrow 一起使用时出现溢出错误
PySpark 1.6.1 DataFrame.write.parquet 作业未完成
使用 parquet 格式时是否保存了 DataFrame 模式？
Parquet 文件中的特殊符号是什么？
Pyspark 将文件保存为 parquet 并读取

1 2 ... 37 38 39 ... 53 54

©2023 WhoseBug