获取已删除文档的有效方法

efficient way to get deleted documents

我正在寻找一种有效的方法来获取 Cloudant 数据库中删除的文档列表。

背景:我有一个包含 400 万条记录的 Cloudant 数据库。业务逻辑还允许删除文档。此数据库中的数据每天加载到 SQL 数据仓库中,并且还需要标记为已删除。

完全重新加载是不可能的,因为它需要太长时间。如果 Cloudant 数据库包含如此多的文档,查询 _changes 流似乎也无法很好地扩展。

我会使用 _changes 提要并应用 server-side 过滤函数 (http://guide.couchdb.org/draft/notifications.html) 来消除所有没有 _deleted属性 设置。因此,只有在报告删除操作并且网络流量保持在最低限度时,您的更改提要侦听器才会收到通知。