SOLR post json 文件默认字段类型
SOLR post json file Default fieldtype
我的 json 文件中有 POSTAL_CODE 字段。如果我尝试使用 solr/post 将该数据导入 SOLR,则字段类型被设置为 'plongs',这不适合像“108-0023”这样的数据。因为数据导入抛出错误。有解决此类问题的方法吗?
编辑:
您可以用来检查它的示例数据。
{
"id": "1",
"POSTAL_CODE": "1982"
},
{
"id": "2",
"POSTAL_CODE": "1947"
},
{
"id": "3",
"POSTAL_CODE": "19473"
},
{
"id": "4",
"POSTAL_CODE": "19471"
},
{
"id": "5",
"POSTAL_CODE": "1947-123"
}
在上面的示例中,我不明白为什么 'id' 没有被视为 'plongs' 或 'pints',而只有 'POSTAL_CODE' 有这个问题。如果第一个元素有 POSTAL_CODE,比如“1947-145”,那么字段类型将被视为 'text_general'。通常,如果该值有双引号(即 "Data": "123"),它不应该被视为字符串值吗?
我试图通过创建一个带有字段 POSTAL_CODE 的原始 json 文档来导入数据。下面是我的 json & 我的 solr 版本是 7.2.1
{"array": [1,2,3],"boolean": true,"color": "#82b92c","null": null,"number": 123,"POSTAL_CODE": "108-0023"}
它在solr中被索引为文本字段,下面是所附的屏幕截图。我触发的索引数据的命令如下:
bin/post -c gettingstarted test.json
能否提供您遇到此问题的示例数据和solr版本。
删除集合,将其创建为新集合,然后在索引任何内容之前,在架构中将字段 POSTAL_CODE 定义为字符串类型。然后,这将在不猜测的情况下为该字段上的任何传入数据编制索引,而是使用字符串类型,这意味着它按原样编制索引。
从 https://lucene.apache.org/solr/guide/7_0/schema-api.html 复制和改编,但未经测试:
curl -X POST -H 'Content-type:application/json' --data-binary '{
"add-field":{
"name":"POSTAL_CODE",
"type":"string",
"stored":true }
}' http://localhost:8983/solr/yourcollectionhere/schema
我的 json 文件中有 POSTAL_CODE 字段。如果我尝试使用 solr/post 将该数据导入 SOLR,则字段类型被设置为 'plongs',这不适合像“108-0023”这样的数据。因为数据导入抛出错误。有解决此类问题的方法吗?
编辑: 您可以用来检查它的示例数据。
{
"id": "1",
"POSTAL_CODE": "1982"
},
{
"id": "2",
"POSTAL_CODE": "1947"
},
{
"id": "3",
"POSTAL_CODE": "19473"
},
{
"id": "4",
"POSTAL_CODE": "19471"
},
{
"id": "5",
"POSTAL_CODE": "1947-123"
}
在上面的示例中,我不明白为什么 'id' 没有被视为 'plongs' 或 'pints',而只有 'POSTAL_CODE' 有这个问题。如果第一个元素有 POSTAL_CODE,比如“1947-145”,那么字段类型将被视为 'text_general'。通常,如果该值有双引号(即 "Data": "123"),它不应该被视为字符串值吗?
我试图通过创建一个带有字段 POSTAL_CODE 的原始 json 文档来导入数据。下面是我的 json & 我的 solr 版本是 7.2.1
{"array": [1,2,3],"boolean": true,"color": "#82b92c","null": null,"number": 123,"POSTAL_CODE": "108-0023"}
它在solr中被索引为文本字段,下面是所附的屏幕截图。我触发的索引数据的命令如下:
bin/post -c gettingstarted test.json
能否提供您遇到此问题的示例数据和solr版本。
删除集合,将其创建为新集合,然后在索引任何内容之前,在架构中将字段 POSTAL_CODE 定义为字符串类型。然后,这将在不猜测的情况下为该字段上的任何传入数据编制索引,而是使用字符串类型,这意味着它按原样编制索引。
从 https://lucene.apache.org/solr/guide/7_0/schema-api.html 复制和改编,但未经测试:
curl -X POST -H 'Content-type:application/json' --data-binary '{
"add-field":{
"name":"POSTAL_CODE",
"type":"string",
"stored":true }
}' http://localhost:8983/solr/yourcollectionhere/schema