Solr 中的结构化和非结构化数据索引

Structured and Unstructured data indexing in Solr

我们要求系统中同时包含结构化和非结构化数据。我们需要为它们建立索引,然后在其上启用搜索功能。我们在 Hadoop 平台上使用 SolrCloud。对于结构化数据,我们计划将数据放入 HBase,对于非结构化数据,我们将直接放入 HDFS。

我的问题是如何在单个 Solr 内核下索引这些资源?是否可以在 SolrCloud 中的单个 core/collection 下索引结构化和非结构化数据,然后在该索引上启用搜索功能?

提前致谢。

您最多可以拥有一个 Solr 架构,其中包含所有可能的字段名称,即您的结构化和非结构化数据。另请注意,由于您提到了非结构化,因此您可以将更多字段名称附加到现有架构文件中。如果您无法添加字段,那么您需要考虑其他方法来实现。

因此,对于您的结构化数据,您只需填充特定于结构化数据的字段的值,其余字段保持不变。

对于Solr中的单个核心和索引,以上所述实际上是如何让不同的文档具有不同的结构。

如果您在问题中有不同的意思,请回复我。