Elastic Search 5 和 SQL 服务器同步

Elastic Search 5 and SQL Server synchronisation

我正在从实际位于 SQL 服务器中的数据开始 Elastic search 5 项目,所以我从头开始:

我正在考虑如何从我的SQL服务器导入数据,尤其是在更新或添加数据时如何同步我的数据。

我看到了here建议不要做太频繁的批次

但是如何做同步批处理,​​可能是我自己写的还是有很常用的工具和做法? River and JDBC plugin feeder 似乎已被真正使用,但不适用于 Elastic Search 5。*

非常欢迎任何帮助。

我建议使用 Logstash:

  • 易于使用和设置
  • 您可以在 logstash 配置文件中进行自己的 ETL
  • 您可以在一个文件中包含多个 JDBC 来源
  • 您将了解如何进行增量(批量)更新以同步您的数据。这实际上取决于您的数据模型。

这是一篇不错的博文开头:

https://www.elastic.co/blog/logstash-jdbc-input-plugin