如何在 Python 中对单个 JSON 文件使用 Elasticsearch 批量索引
How to use Elasticsearch bulk index with single JSON file in Python
我有一个 JSON 格式的文件:
{"index":{"_type": "summary", "_id": "0001-1200-2015-12-31-0007", "_index": "transaction"}}
{"data_load_user_id": "nathan", "tender_time": 5, "ring_time": 8, "operator_id": "0111"}
大约 12,000 行。据我所知,这是在 elasticsearch 中为批量 API 格式化 JSON 文件的正确方法。我仍然对如何将 es.bulk() 与此单个文件作为输入一起使用感到困惑。我已经为每一行指定了索引和 ID。
啊好的,所以 helpers.bulk()
模块将字典列表和我的 elasticsearch 客户端作为参数,而不是每个条目有 2 行 JSON 文件,我只需要添加 "_index"
"type"
和每个 JSON 字典的 "_id"
并且它起作用了!
我有一个 JSON 格式的文件:
{"index":{"_type": "summary", "_id": "0001-1200-2015-12-31-0007", "_index": "transaction"}}
{"data_load_user_id": "nathan", "tender_time": 5, "ring_time": 8, "operator_id": "0111"}
大约 12,000 行。据我所知,这是在 elasticsearch 中为批量 API 格式化 JSON 文件的正确方法。我仍然对如何将 es.bulk() 与此单个文件作为输入一起使用感到困惑。我已经为每一行指定了索引和 ID。
啊好的,所以 helpers.bulk()
模块将字典列表和我的 elasticsearch 客户端作为参数,而不是每个条目有 2 行 JSON 文件,我只需要添加 "_index"
"type"
和每个 JSON 字典的 "_id"
并且它起作用了!