Solr 索引 parquet 文件

Solr indexing parquet file

我有一个 solr 实例 运行,它应该读取 parquet 文件以进行索引。现在,我正在将 parquet 转换为平面文本文件,然后让 solr 索引它们。我想知道是否可以直接读取 parquet 文件供 Solr 使用?

谢谢

直接:不,不可能。

如果您想要比实际操作更集成的东西(转换为文本和索引可能已经足够好了),您可以采用两种方式:

  1. 围绕 DIH 创建一个专门的代码,你可能会写一个专门的 DataSource,这样你就可以使用 DIH 来做索引。
  2. 只需使用 SolrJ 编写一些 java 代码,将您的文件和索引写入 Solr