如何将数据从 Cassandra 导出到 mongodb?

How to export data from Cassandra to mongodb?

我正在实时使用 Apache (Kafka-Storm-Cassandra) processing.The 我面临的问题是我不能直接在 Cassandra 上使用聚合查询(可以使用 Datastax,但它是付费的服务)。此外,我也考虑过使用 mongodb 但它不利于更多和频繁的写入。因此,我正在考虑在 Storm 中进行所有计算并将其存储到 Cassandra 中,然后大约每小时将其移动到 mongodb 以执行我的进一步分析。

这是正确的方法还是有更好的选择?

Also, How can I export data directly from Cassandra to mongodb prefebly using JAVA?

提前致谢!!

在不知道您的全部要求的情况下,inserts/updates 的数量无法预测这是好方法还是坏方法。 Mongo 不太适合大量写入,但它可以很好地支持否。插入物。非常重要的是你每单位时间有多少写入,你可以根据它做出决定。

我已经看到 Mongo 在服务器 class 机器上每秒写入 1000-2000 次,平均为 4-5 毫秒。当然,Cassandra 以优势胜过它,但如果您需要执行任何聚合,那么 Mongo 具有更好的框架和功能。

对于导出和导入,可以使用平面 csv。 Cassandra 可以将数据导出到 csv,MongoDB 可以使用 export/import 选项从 csv 导入数据。

检查 MongoImport 并从 cassandra 导出, 例如,

copy employee (emp_id, dept, designation, emp_name, salary)
 to 'employee.csv';