如何将 Kaggle 数据集添加到 elasticsearch?
how do I add Kaggle dataset into elasticsearch?
我是 elasticsearch 的新手,我正在尝试构建一个电影搜索应用程序。为此,我计划从 kaggle 获取数据并添加到我在 localhost:9200 本地设置的 elasticsearch。我在本地主机 link:
中看到了这个
name "bxiIZLL"
cluster_name "elasticsearch"
cluster_uuid "zc_JPmw4TQ2G5bvahEF6LQ"
version
number "5.6.14"
build_hash "f310fe9"
build_date "2018-12-05T21:20:16.416Z"
build_snapshot false
lucene_version "6.6.1"
tagline "You Know, for Search"enter code here
现在我需要向此服务器添加 Kaggle 数据。我该怎么做?
我在某处看到了 curld -XPUT 命令。我不确定它如何与 Kaggle 一起工作。
一个后续问题 - 如果我想稍后发布我的应用程序,我该如何托管 elasticsearch ?
为了将 CSV 文件上传到 elasticsearch:
- 下载文件。
- 使用 logstash 以便使用 file input
读取文件
- 使用 logstash 的 CSV filter
根据需要修改和转换数据
- 将 logstash 输出到 elasticsearch
关于您的后续问题——我如何托管 Elasticsearch——您可以 运行 自己 运行 它,例如在 AWS EC2 中,或者使用 Elastic 云或 AWS ES 等托管服务。祝你好运
我是 elasticsearch 的新手,我正在尝试构建一个电影搜索应用程序。为此,我计划从 kaggle 获取数据并添加到我在 localhost:9200 本地设置的 elasticsearch。我在本地主机 link:
中看到了这个name "bxiIZLL"
cluster_name "elasticsearch"
cluster_uuid "zc_JPmw4TQ2G5bvahEF6LQ"
version
number "5.6.14"
build_hash "f310fe9"
build_date "2018-12-05T21:20:16.416Z"
build_snapshot false
lucene_version "6.6.1"
tagline "You Know, for Search"enter code here
现在我需要向此服务器添加 Kaggle 数据。我该怎么做? 我在某处看到了 curld -XPUT 命令。我不确定它如何与 Kaggle 一起工作。
一个后续问题 - 如果我想稍后发布我的应用程序,我该如何托管 elasticsearch ?
为了将 CSV 文件上传到 elasticsearch:
- 下载文件。
- 使用 logstash 以便使用 file input 读取文件
- 使用 logstash 的 CSV filter 根据需要修改和转换数据
- 将 logstash 输出到 elasticsearch
关于您的后续问题——我如何托管 Elasticsearch——您可以 运行 自己 运行 它,例如在 AWS EC2 中,或者使用 Elastic 云或 AWS ES 等托管服务。祝你好运