具有多值字段的 Solr 索引处理程序
Solr Index Handlers with Multivalue Field
我想通过索引处理程序将 CSV 导入 solr,如文档中所述:
https://solr.apache.org/guide/7_1/uploading-data-with-index-handlers.html#csv-update-parameters
我有一个具有以下结构的 CSV:
ID | Name | Property |
1 | Tee | Sweet |
1 | Tee | Fluid |
1 | Tee | Hot |
2 | Bread | Salty |
3 | Milk | Fluid |
如果 ID 相同,则第一个值始终相等,只有 属性 不同。现在我想将 属性 作为多值字段导入到 solr.
有没有办法通过索引处理程序实现这一点。如果不是,怎么办?
我将编写一个程序来扫描 CSV 数据并生成 JSON 您可以导入 Solr 的对象。这将要求您扫描 CSV 文件中的所有行,以便您可以聚合具有相同 ID 的行的属性,这样您最终会得到 JSON,如下所示:
[
{id: 1, name: "Tree", properties: ["Sweet", "Fluid", "Hot"]},
{id: 2, name: "Bread", properties: ["Salty"]},
{id: 3, name: "Milk", properties: ["Fluid"]}
]
您将希望使用与您的架构或动态字段定义相匹配的字段名称,以便它们也能正确编入索引。
我想通过索引处理程序将 CSV 导入 solr,如文档中所述: https://solr.apache.org/guide/7_1/uploading-data-with-index-handlers.html#csv-update-parameters
我有一个具有以下结构的 CSV:
ID | Name | Property |
1 | Tee | Sweet |
1 | Tee | Fluid |
1 | Tee | Hot |
2 | Bread | Salty |
3 | Milk | Fluid |
如果 ID 相同,则第一个值始终相等,只有 属性 不同。现在我想将 属性 作为多值字段导入到 solr.
有没有办法通过索引处理程序实现这一点。如果不是,怎么办?
我将编写一个程序来扫描 CSV 数据并生成 JSON 您可以导入 Solr 的对象。这将要求您扫描 CSV 文件中的所有行,以便您可以聚合具有相同 ID 的行的属性,这样您最终会得到 JSON,如下所示:
[
{id: 1, name: "Tree", properties: ["Sweet", "Fluid", "Hot"]},
{id: 2, name: "Bread", properties: ["Salty"]},
{id: 3, name: "Milk", properties: ["Fluid"]}
]
您将希望使用与您的架构或动态字段定义相匹配的字段名称,以便它们也能正确编入索引。