具有多值字段的 Solr 索引处理程序

Solr Index Handlers with Multivalue Field

我想通过索引处理程序将 CSV 导入 solr,如文档中所述: https://solr.apache.org/guide/7_1/uploading-data-with-index-handlers.html#csv-update-parameters

我有一个具有以下结构的 CSV:

ID    |    Name    |    Property    |
1     |    Tee     |     Sweet      |
1     |    Tee     |     Fluid      |
1     |    Tee     |      Hot       |
2     |   Bread    |     Salty      |
3     |    Milk    |     Fluid      |

如果 ID 相同,则第一个值始终相等,只有 属性 不同。现在我想将 属性 作为多值字段导入到 solr.

有没有办法通过索引处理程序实现这一点。如果不是,怎么办?

我将编写一个程序来扫描 CSV 数据并生成 JSON 您可以导入 Solr 的对象。这将要求您扫描 CSV 文件中的所有行,以便您可以聚合具有相同 ID 的行的属性,这样您最终会得到 JSON,如下所示:

[
{id: 1, name: "Tree", properties: ["Sweet", "Fluid", "Hot"]},
{id: 2, name: "Bread", properties: ["Salty"]},
{id: 3, name: "Milk", properties: ["Fluid"]}
]

您将希望使用与您的架构或动态字段定义相匹配的字段名称,以便它们也能正确编入索引。