如何将 Kaggle 数据集添加到 elasticsearch?

how do I add Kaggle dataset into elasticsearch?

我是 elasticsearch 的新手,我正在尝试构建一个电影搜索应用程序。为此,我计划从 kaggle 获取数据并添加到我在 localhost:9200 本地设置的 elasticsearch。我在本地主机 link:

中看到了这个
name    "bxiIZLL"
cluster_name    "elasticsearch"
cluster_uuid    "zc_JPmw4TQ2G5bvahEF6LQ"
version 
number  "5.6.14"
build_hash  "f310fe9"
build_date  "2018-12-05T21:20:16.416Z"
build_snapshot  false
lucene_version  "6.6.1"
tagline "You Know, for Search"enter code here

现在我需要向此服务器添加 Kaggle 数据。我该怎么做? 我在某处看到了 curld -XPUT 命令。我不确定它如何与 Kaggle 一起工作。

一个后续问题 - 如果我想稍后发布我的应用程序,我该如何托管 elasticsearch ?

为了将 CSV 文件上传到 elasticsearch:

  1. 下载文件。
    1. 使用 logstash 以便使用 file input
    2. 读取文件
    3. 使用 logstash 的 CSV filter
    4. 根据需要修改和转换数据
    5. 将 logstash 输出到 elasticsearch

关于您的后续问题——我如何托管 Elasticsearch——您可以 运行 自己 运行 它,例如在 AWS EC2 中,或者使用 Elastic 云或 AWS ES 等托管服务。祝你好运