在 mongo 中,我能否仅在记录不存在时插入该记录

in mongo can I insert a record only if it's not already there

我正在使用以唯一哈希键控的不可变对象。我的客户不知道对象是否是数据库。我只想在对象尚不存在时插入。

我知道我可以查询然后插入,但这涉及额外的往返。

我知道我可以插入并生成重复键异常(在我的客户端中),但这涉及尴尬的异常处理。

我知道我可以更新插入,但这涉及完全不必要的数据库操作。

在 sql 中,我会在服务器端使用存储过程。 但我不清楚服务器端 javascript 如何(如果有的话)为此工作。 有什么建议吗?

我真的认为,如果您查看从 MongoDB 2.6 及更高版本实现的 Bulk Operations API,那么您应该会发现更新根本不是触及数据库内容的问题。

例如 MongoDB shell 方法现在实际上都使用批量操作 API "under the hood"。从 shell 中返回的 WriteResult 对象可以立即看出这一点,但您也可以检查方法签名定义来揭示这一点。

基本测试:

db.uptest.update(
    { "data": "test" },
    { "$set": { "data": "test }}, 
    { "upsert": true }
)

WriteResult({
    "nMatched" : 0,
    "nUpserted" : 1,
    "nModified" : 0,
    "_id" : ObjectId("54f97d8ee43b0048f69c5d88")
})

原来是这样插入的,现在再发出时:

db.uptest.update(
    { "data": "test" },
    { "$set": { "data": "test }}, 
    { "upsert": true }
)

WriteResult({ "nMatched" : 1, "nUpserted" : 0, "nModified" : 0 })

什么也没做。因为在更新中发送的数据与驻留在那里的数据相同。 MongoDB 有智慧知道这一点,一旦确定就不会实际执行其他 I/O。

除此之外,我不确定您认为自己想要实现什么。你怎么可能 "know" 不询问数据库中的内容?实现此目的的唯一其他方法是以某种方式在您的应用程序中 "cache" 数据,然后在向数据库发出语句之前先询问缓存。这可能是多余的,而且几乎没有必要,因为调用本身应该非常快。

当然总是有 $setOnInsert 修饰符用于高度偏执或用于特定目的。这绝对不会写任何东西,除非操作是特定的 "insert".

在较长的形式中,直接使用 API 调用将如下所示:

var bulk = db.uptest.initializeOrderBulkOperation();
bulk.find({ "data": "test"})
    .upsert()
    .updateOne({ "$setOnInsert": { "data": "test" } });
bulk.execute();

在一般原则上,这在所有语言实现中都非常一致。

MongoDB 2.6 已经存在一段时间了,大多数供应商都将其用作标准部署。 MongoDB 撰写本文时 3.0 刚刚发布。

所以可用的新写入协议应该是您正在使用的。随着时间的推移,驱动程序默认方法可能会默认为此,至少执行与 shell 方法中实现的相同类型的 "server version checking"。

因此,即使对于单个调用,(您可能应该组织批量调用以进行纯 "one shot" 更新以外的任何操作),因为使用较新的 API 来实现您的逻辑。还可以在适当的地方使用 $setOnInsert