首页
标签

parquet

AWS 胶水作业将字符串映射到日期和时间格式，同时从 csv 转换为镶木地板
如何在 Java/Scala 中将镶木地板模式转换为 avro
阅读 Hive table 并将其转换为 Parquet Table
Spark 重新分区未按预期工作
从 Spark 将许多文件写入镶木地板 - 缺少一些镶木地板文件
Pandas：从 parquet 文件中读取前 n 行？
如何将我的 JsonObject (com.google.gson.JsonObject) 转换为 GenericRecord (org.apache.avro.generic.GenericRecord) 类型
我正在尝试在 TDCH jar 1.6 版本的帮助下将 teradata 中的镶木地板文件存储在 HDFS 中
pandas.read_csv 中是否有与 chunksize 参数等效的 pyarrow？
使用从 parquet 文件创建的 dask 数据帧时内存使用过多
使用 python 和 pandas 传输和写入 Parquet 时出现时间戳错误
如何根据 table 中的数据获取镶木地板文件名
Athena：仅使用 JSON 个字段的子集
镶木地板上的配置单元外部 table 未获取数据
通过 Spark 查询 Cassandra UDT SQL
Pyarrow.lib.Schema 对比 pyarrow.parquet.Schema
Int96Value 到日期字符串
MSCK REPAIR TABLE 在幕后做了什么，为什么这么慢？
如何在 C++ 中保存镶木地板文件中的时间戳并将其加载到 Python Pandas 中？
使用 Spark 处理大于集群可以容纳的数据集

1 2 ... 28 29 30 ... 53 54

©2023 WhoseBug