Flink-BigTable - 任何连接器?

Flink-BigTable - Any connector?

我想使用 BigTable 作为 Flink 作业的接收器:

  1. 是否有开箱即用的连接器?
  2. 我可以使用 Datastream API 吗?
  3. 如何以最佳方式传递稀疏对象(99% 稀疏度),即确保没有 key/value 在 BigTable 中为空值创建?

我已经搜索了上述主题的文档,但无法回答这些问题。

感谢您的支持!

我认为 Flink 没有原生的 BigTable 连接器。

也就是说,您可以使用 Flink HBase SQL Connector with BigTable HBase client 从 Flink 访问 BigTable:

Flink job <-> Flink HBase SQL Connector <-> BigTable HBase client <-> BigTable

此连接器似乎与 Flink HBase connector proposed by Cloudera and that can be (see comment @rsantiago) 相似。

可以从 Cloudera 的 example where columns are added with put.addColumn so that in you could evaluate in that section if it is null and discard it (see comment @rsantiago).

中获取关于稀疏数据持久性的可能方法。