如何在聚合管道 mongodb 中使用 $update/ $set 运算符?

How to use $update/ $set operator in aggregation pipeline mongodb?

我正在尝试根据特定条件更新 coll1 collection 中名为 name 的字段。我首先创建了一个聚合管道,它根据我的标准过滤掉文档。

var local_filter = { "$or" :[ 
                                          {'fullText': {'$eq': "404 Error"}},
                                          {'fullText': {'$eq': "Unknown Error"}},
                                          {'fullText': {'$eq': "503 Error"}},
                                          {'fullText': {'$eq': "400 Error"}},
                                          {'fullText': {'$eq': "500 Error"}},
                                          {'fullText': {'$eq': "Read timed out"}},
                                          {'fullText': {'$eq': "410 Error"}},
                                          {'fullText': {'$eq': "403 Error"}},
                                          {"fullText": {'$eq':""}},
                              ]}

var foreign_filter= { "$and" :[
                              {'matchingrecords.Text': {'$ne': "404 Error"}},
                              {'matchingrecords.Text': {'$ne': "Unknown Error"}},
                              {'matchingrecords.Text': {'$ne': "503 Error"}},
                              {'matchingrecords.Text': {'$ne': "400 Error"}},
                              {'matchingrecords.Text': {'$ne': "500 Error"}},
                              {'matchingrecords.Text': {'$ne': "Read timed out"}},
                              {'matchingrecords.Text': {'$ne': "410 Error"}},
                              {'matchingrecords.Text': {'$ne': "403 Error"}},
                              {"matchingrecords.Text": {'$ne': ""}},
                              {"matchingrecords.Text": {'$ne':'null'}}
                              ]}

db.coll1.aggregate([
    {$match:local_filter //9474
    },
    {$lookup: {
           from: "coll2",
           localField: "_id",   //from coll1
           foreignField: "_id", //from coll2
           as: "matchingrecords"
         }//4518
    },
    { $match: foreign_filter
    },
    { $match: {matchingrecords: {$ne:[]} }
    },//3645
    {
      $count: "totalCount"
    }
    ])//3645

所以,我现在在 coll1 中得到 3645 个文档,我需要更新 name 字段。我尝试了两种方法,但都不起作用:

  1. { $set: { "Name" :matchingrecords.Text} } 添加到上述管道。这将 Name 按字面意义设置为字符串 matchingrecords.Text 而不是它的值。此外,添加 $ 也无济于事!

  2. 使用 aggregation with Update,我在 u 子句中传递了聚合管道。

    db.runCommand(
              {
                update: "coll1",
                updates: [
                   {
                     q: { },
                     u: [// You can pass you aggregation pipeline here
                             {$match: local_filter//9474
                              },
                              {$lookup: {
                                     from: "coll2",
                                     localField: "_id",
                                     foreignField: "_id",
                                     as: "matchingrecords"
                                   }//4518
                              },
                              { $match: foreign_filter
                              },
                              { $match: {matchingrecords: {$ne:[]} }
                              },//3645
                              { $set: { "Name" : 'matchingrecords.Text' } }
                         ],
                         multi: true
                       }
                    ],
                    ordered: false,
                    writeConcern: { w: "majority", wtimeout: 5000 }
                 })

它抱怨 $match operator isn't allowed in update!

{ 
    "n" : 0.0, 
    "nModified" : 0.0, 
    "writeErrors" : [
        {
            "index" : 0.0, 
            "code" : 72.0, 
            "errmsg" : "$match is not allowed to be used within an update"
        }
    ], 
    "ok" : 1.0
}

关于如何更新我的 3645 文档有什么建议吗?

有一个简单的技巧!

解决方案(对我有用!):

  1. 使用 coll1,创建一个包含 3645 个文档的新 collection。
      db.coll1.aggregate([
        {$match:filter //9474
        },
        {$lookup: {
               from: "coll2",
               localField: "_id",
               foreignField: "_id",
               as: "matchingrecords"
             }//4518
        },
        { $match: foreign_filter
        },
        { $match: {matchingrecords: {$ne:[]} }
        },//3645
        { $unwind: { path: "$matchingrecords", preserveNullAndEmptyArrays: true }
        },
        { $project : <what All fields you Need?>
        },
        { $out: "child_coll1"
        }//get 3645 in the a new collection
  1. 使用 coll1,在单独的 collection
  2. 中获取 non-matched 文档
   db.coll1.aggregate([
        {$lookup: {
               from: "child_coll1",
               localField: "_id",
               foreignField: "_id",
               as: "matchingrecords"
             }//
        },
        { $match: {matchingrecords: {$eq:[]} }
        },//30944
        { $unwind: { path: "$matchingrecords", preserveNullAndEmptyArrays: true }
        },
        { $out: "child_coll2"
        }//get out 30944 docs other than 3645
    ])
  1. 只需从 1 和 2
  2. 合并新的 collection
        db.child_coll1.find().forEach(function(doc){
           db.child_coll2.insert(doc); 
        });
  1. 删除除child_coll2以外的所有collection,可以重命名为coll1

这不是一个优雅的解决方案,只是一个完成任务的技巧!有没有人在一个查询中有 better/elegant 解决方案?

为什么您的第一个聚合解决方案不起作用?

$set 不是聚合管道的有效阶段运算符。

为什么使用更新命令的第二个解决方案不起作用?

Update 命令不接受聚合管道运算符。根据 @prasad_

共享的 reference,仅支持从 mongo@4.2 开始的几个运算符

那么如何解决这个问题呢?

检查您是否可以将 $replaceRoot 用于您的用例。如果没有,您可以使用以下技巧。

首先,像之前一样从聚合开始,然后添加 $addFields 阶段为每个文档添加一个新字段,其中包含您要设置的值。然后运行另一个更新命令如下

db.coll1.aggregate([
   { 
   // your match queries 
   },
   {
   $addFields: { myNewName: "myvalue" } 
   }
]).toArray().forEach(function(myDoc){
   db.coll1.update({ _id: myDoc.id }, { $set: {Name: myDoc.myNewName } })
})