如何为 apache drill 编写自定义存储插件

How to write custom storage plugin for apache drill

我的数据采用适当的格式,None Apache drill 支持的格式。 有没有关于如何编写我自己的存储插件来处理此类数据的教程。

这确实应该包含在文档中,但目前没有。界面并不太复杂,但是查看现有插件之一并了解正在发生的一切可能有点复杂。

编写存储插件有 2 个主要组成部分,向查询计划器和模式管理系统公开信息,然后实际实现从数据源 API 到钻取记录表示的转换。

Kudu 插件是最近添加的,它是具有 Drill 可以利用的大量元素的存储系统的合理模型。我要注意的一件事是,如果您的存储系统不是分布式的,并且您只是计划进行所有远程读取,那么您不必在组扫描中围绕 affinities/work lists/assignments 做太多工作。如果我很快有时间,我会尝试写一个关于界面不同部分的文档,并可能写一个关于现有插件之一的教程。

https://github.com/apache/drill/tree/master/contrib/storage-kudu/src/main/java/org/apache/drill/exec/store/kudu