在 SnappyData v.0.5.2 中找不到内置提供程序 com.databricks.spark.csv

builtin provider com.databricks.spark.csv not found in SnappyData v.0.5.2

SnappyData v.0.5.2

我正在使用这个 SnappyData 版本来修复 SNAP-961。

但是,在从预览版 v0.5 移动到 v0.5.2 后,现在我无法再从 CSV 加载数据。

错误是:

ERROR 38000: (SQLState=38000 Severity=-1) (Server=ip-10-0-18-66.us-west-2.compute.internal[1528],Thread[DRDAConnThread_28,5,gemfirexd.daemons]) The exception 'Failed to find a builtin provider com.databricks.spark.csv;' was thrown while evaluating an expression.

这是我正在执行的:

-- creates in-memory table from csv
CREATE TABLE STAGING_ROAD (road_id string, name string) USING com.databricks.spark.csv OPTIONS(path 'roads.csv', header 'true', inferSchema 'false');

SQL 和 Spark API 对齐,所以现在只有内置数据源(列、行、streaming/AQP 个)可以使用 "CREATE TABLE",而其他的必须使用 "CREATE EXTERNAL TABLE"。与 SnappyContext 的情况类似,其中 createTable API 只能用于内置源,而对于其他源,则需要 createExternalTable。以下内容适用于旧版本和新版本:

CREATE EXTERNAL TABLE STAGING_ROAD (road_id string, name string) USING com.databricks.spark.csv OPTIONS(path 'roads.csv', header 'true', inferSchema 'false')