Apache drill 在 TSV 中丢失 unicode

Apache drill losing unicode in TSVs

我在 Apache drill 中使用 text/tsv 存储插件,输出的 tsv 文件有 ?对于 unicode 字符。如果我使用 JSON 存储插件,unicode 就可以了。

类似于:

URL: http://localhost:8047/query.json

有效负载:

{
  "queryType":"SQL",
  "query": "CREATE TABLE st.`repo`.`test` AS SELECT * FROM st.`repo`.`unicode_data`"
}

设置JVM文件编码,这是固定的。

JAVA_TOOL_OPTIONS=-Dfile.encoding=UTF8