Apache drill 在 TSV 中丢失 unicode
Apache drill losing unicode in TSVs
我在 Apache drill 中使用 text/tsv 存储插件,输出的 tsv 文件有 ?对于 unicode 字符。如果我使用 JSON 存储插件,unicode 就可以了。
类似于:
URL: http://localhost:8047/query.json
有效负载:
{
"queryType":"SQL",
"query": "CREATE TABLE st.`repo`.`test` AS SELECT * FROM st.`repo`.`unicode_data`"
}
设置JVM文件编码,这是固定的。
JAVA_TOOL_OPTIONS=-Dfile.encoding=UTF8
我在 Apache drill 中使用 text/tsv 存储插件,输出的 tsv 文件有 ?对于 unicode 字符。如果我使用 JSON 存储插件,unicode 就可以了。
类似于:
URL: http://localhost:8047/query.json
有效负载:
{
"queryType":"SQL",
"query": "CREATE TABLE st.`repo`.`test` AS SELECT * FROM st.`repo`.`unicode_data`"
}
设置JVM文件编码,这是固定的。
JAVA_TOOL_OPTIONS=-Dfile.encoding=UTF8