DataProxy 与数据预览

DataProxy vs DataPreview

我已经设置了 CKAN 2.8,并计划将其用作为本地网络上的用户提供文件服务的门户。许多资源都上传到无法从互联网访问的 CKAN 服务器。我希望 Data Explorer 预览能够正常工作,并且想知道最佳方法。我安装了一些插件,其中一个可能是 ckanext-resourceauthorizer.

我看到两个不完整的解决方案,但也对其他人开放

  1. 由于无法通过 Internet 访问服务器,因此常规 DataProxy 将无法工作。我更新后发现 docker image 并且能够安装本地实例并将 recline.js dataproxy_url 指向它。这适用于我的 public 数据集,但私有数据集出现 404 错误且无法预览。

  2. 我看到 ckanext-datapreview 执行类似的功能,但注释指出需要修改倾斜度才能使用扩展。看来这个修改不止是改动了url,但是一直找不到更多的资料。

我正在寻找有关最佳前进道路的建议:

这些选项中的任何一个都可以提供我正在寻找的预览吗?

DataProxy 据说已被弃用,这是避免它的原因吗?

是否有与 ckanext-datapreview 接口的独立补丁倾斜?

CKAN 站点显示数据预览的推荐方式是使用 DataStore 和 DataPusher 或 XLoader. When a dataset is present in Datastore, then the package (metadata) should have the datastore_enabled flag set to true and recline will simply get the data from Datastore (postgres), in preference to DataProxy service. To get the data into Datastore when ever a dataset is added to CKAN, then you can setup DataPusher or XLoader.

DataProxy 是安装 CKAN 时的默认设置,但这不是一个很好的解决方案。它仅在一个 free/cheap AppEngine 网络服务中运行,由全球所有尚未配置为使用更好的东西的 CKAN 共享。正如您所发现的,因为它在 CKAN 外部并且不持有您的 CKAN 的任何凭证,所以它无法访问私有数据集或本地数据。它不太擅长解析与众不同的 CSV。早就deprecated因为不是很好

ckanext-preview held a lot of promise, but is sadly no longer maintained - feel free to give it some love. It's an efficient and robust way of parsing CSVs into JSON on the fly i.e. without having to hold it in DataStore or other database. I can't quite remember what little change is needed to recline for them to talk, but this could be it: https://github.com/datagovuk/ckanext-dgu/commit/053e3df96b51cb775c092430bc435939a8c6f492