如何从 Retrieve and Rank (Solr) 下载所有文档?

How can I download all documents from Retrieve and Rank (Solr)?

我们在 Bluemix 上有一个 Cloudant 数据库,其中包含大量文档,这些文档是由文档转换服务构建的答案单元。这些答案单元用于为我们的应用程序填充 Solr Retrieve 和 Rank 集合。 Cloudant 数据库用作我们的回答单元记录系统。

由于不重要的原因,我们的 Cloudant 数据库不再有效。我们需要的是一种从 Solr 集合下载所有内容并重新创建 Cloudant 数据库的方法。谁能告诉我一个方法吗?

您可以将一个 Cloudant 数据库复制到另一个,这将为您创建一个完全相同的副本。

另一种技术是使用诸如 couchbackup 之类的工具,它可以获取数据库文档的副本(忽略任何删除)并允许您将数据保存在文本文件中。然后,您可以使用 couchrestore 工具将数据文件上传到新数据库。

有关详细信息,请参阅 this blog

我不知道有任何自动执行此操作的方法。

您需要从 Solr 获取所有文档(假设您有很多文档,请以分页方式执行此操作 - Solr doc 中有一些如何执行此操作的示例)并将它们添加到 Cloudant 中。

请注意,您只能对您在架构中设置为 stored 的字段执行此操作。如果您在 Cloudant 中需要的重要字段尚未存储在 Solr 中,那么您可能会遇到困难。 :(