带有 Snappy 压缩的 Avro

Avro with Snappy Compression

将 *.dat 文件转换为 *.avro 的任何指针,后者在 .NET Framework 4.5 中使用 Snappy 压缩。我想在我的 Hive 中使用 avro 文件。配置单元是否支持开箱即用的 Avro 格式。我需要提到 serde 来读取 avro 文件吗

Hive 开箱即用地支持 Avro:https://cwiki.apache.org/confluence/display/Hive/AvroSerDe

您可以在 Hive 中定义 Avro 表,类似于:

  CREATE TABLE kst
      PARTITIONED BY (ds string)
      ROW FORMAT SERDE
      'org.apache.hadoop.hive.serde2.avro.AvroSerDe'
      STORED AS INPUTFORMAT
      'org.apache.hadoop.hive.ql.io.avro.AvroContainerInputFormat'
      OUTPUTFORMAT
      'org.apache.hadoop.hive.ql.io.avro.AvroContainerOutputFormat'
      TBLPROPERTIES (
        'avro.schema.url'='http://schema_provider/kst.avsc');

或者从 Hive 0.14 开始,类似于:

CREATE TABLE kst (
    string1 string,
    string2 string
  )
  PARTITIONED BY (ds string)
  STORED AS AVRO;