如何在 Julia 中将 CSV 转换为 Parquet

How to convert CSV to Parquet in Julia

我有一个 CSV 文件,我想在 Julia 中将其转换为 Parquet。我在论坛和有关此转换的文档中找不到任何相关信息。在 Julia 中是否可以进行这种转换,或者我只是简单地将 CSV 读取为 Parquet?如果是这样?我该怎么做呢?

这是我目前所掌握的。

begin
    using Pkg
    Pkg.add("PlutoUI")
    Pkg.add("HTTP")
    Pkg.add("StatsModels")
    Pkg.activate(".")
    import CSV, DataFrames, Dates, StatsPlots, StatsModels
    import DataFrames.DataFrame
    using Plots, PlutoUI, HTTP, DelimitedFiles, Parquet
end

begin
    df = CSV.read("/home/onur/julia-assignment/temp.csv", DataFrame)
end

在下面的代码中使用 Parquet.jl

using CSV,DataFrames,Parquet
c = CSV.read(IOBuffer("a;b;c\n1;2.5;a\n2;3.5;b"), DataFrame, delim=";")
Parquet.write_parquet("dat.parquet", c)

至于测试,让我们试着回读一下:

julia> Parquet.read_parquet("dat.parquet") |> DataFrame
2×3 DataFrame
 Row │ a       b         c
     │ Int64?  Float64?  String?
─────┼───────────────────────────
   1 │      1       2.5  a
   2 │      2       3.5  b