开源中有哪些可用的数据目录选项
What are the data catalog option available in open source
我想知道哪个是满足以下要求的最佳可用数据目录。
- 开源
- 负载均衡器后的高可用性
- 描述数据集
- 可以描述数据集中的数据,能够选择描述数据中的字段
- 数据集可搜索
我查看了 ckan 并给我留下了深刻的印象,但它没有提供数据集内的描述字段
还有其他好的工具吗
您实际上可以扩展 CKAN 并根据您的需要塑造它。 CKAN 是一个非常通用和灵活的产品。
例如用于描述 CKAN 中的字段,您可以使用
https://github.com/ckan/ckanext-scheming
或者您可以按照文档创建自己的扩展。
https://docs.ckan.org/en/2.8/extensions/
您看过 Lyft 的开源数据目录和发现工具 "Amundsen" 了吗?
https://github.com/lyft/amundsen
https://eng.lyft.com/open-sourcing-amundsen-a-data-discovery-and-metadata-platform-2282bb436234
我已经使用了 engrafo-solution (engrafo.eu)
的数据目录部分
开源(10 个用户的免费计划)
在负载均衡器(?)之后高度可用
描述数据集(是)
可以描述数据集内的数据,能够选择描述数据内的字段(是)
数据集可搜索(是)
我想知道哪个是满足以下要求的最佳可用数据目录。
- 开源
- 负载均衡器后的高可用性
- 描述数据集
- 可以描述数据集中的数据,能够选择描述数据中的字段
- 数据集可搜索
我查看了 ckan 并给我留下了深刻的印象,但它没有提供数据集内的描述字段
还有其他好的工具吗
您实际上可以扩展 CKAN 并根据您的需要塑造它。 CKAN 是一个非常通用和灵活的产品。
例如用于描述 CKAN 中的字段,您可以使用 https://github.com/ckan/ckanext-scheming
或者您可以按照文档创建自己的扩展。 https://docs.ckan.org/en/2.8/extensions/
您看过 Lyft 的开源数据目录和发现工具 "Amundsen" 了吗?
https://github.com/lyft/amundsen
https://eng.lyft.com/open-sourcing-amundsen-a-data-discovery-and-metadata-platform-2282bb436234
我已经使用了 engrafo-solution (engrafo.eu)
的数据目录部分开源(10 个用户的免费计划) 在负载均衡器(?)之后高度可用 描述数据集(是) 可以描述数据集内的数据,能够选择描述数据内的字段(是) 数据集可搜索(是)