Solr 索引 parquet 文件
Solr indexing parquet file
我有一个 solr 实例 运行,它应该读取 parquet 文件以进行索引。现在,我正在将 parquet 转换为平面文本文件,然后让 solr 索引它们。我想知道是否可以直接读取 parquet 文件供 Solr 使用?
谢谢
直接:不,不可能。
如果您想要比实际操作更集成的东西(转换为文本和索引可能已经足够好了),您可以采用两种方式:
- 围绕 DIH 创建一个专门的代码,你可能会写一个专门的 DataSource,这样你就可以使用 DIH 来做索引。
- 只需使用 SolrJ 编写一些 java 代码,将您的文件和索引写入 Solr
我有一个 solr 实例 运行,它应该读取 parquet 文件以进行索引。现在,我正在将 parquet 转换为平面文本文件,然后让 solr 索引它们。我想知道是否可以直接读取 parquet 文件供 Solr 使用?
谢谢
直接:不,不可能。
如果您想要比实际操作更集成的东西(转换为文本和索引可能已经足够好了),您可以采用两种方式:
- 围绕 DIH 创建一个专门的代码,你可能会写一个专门的 DataSource,这样你就可以使用 DIH 来做索引。
- 只需使用 SolrJ 编写一些 java 代码,将您的文件和索引写入 Solr