子文档的动态大小 mongodb

dynamic size of subdocument mongodb

我正在为我的 Web 应用程序使用 mongodb 和猫鼬。该网络应用程序用于游泳比赛的注册,每场比赛可以有 X 场比赛。我目前的数据结构:

{
  "_id": "1",
  "name": "Utmanaren",
  "location": "town",
  "startdate": "20150627",
  "enddate": "20150627"
  "race" : {
    "gender" : "m"
    "style" : "freestyle"
    "length" : "100"
  }
}

这样做我需要确定和定义每场比赛的比赛数量。我尝试过的一个解决方案是有一个单独的文件并有一个比赛所属比赛的 Id,如下所示。

{
  "belongsTOId" : "1"
  "gender" : "m"
  "style" : "freestyle"
  "length" : "100"
}
{
  "belongsTOId" : "1"
  "gender" : "f"
  "style" : "butterfly"
  "length" : "50"
}

有没有办法在使用 Mongodb 时创建和定义动态的种族数量作为子文档?

谢谢!

你基本上想更新数据,所以你应该更新数据,这基本上是对子文档键的更新。

  1. 在主文档中保留一组键。
  2. 插入子文档并添加密钥到列表或更新列表。

您基本上有两种建模数据结构的方法;您可以设计一个模式,您可以在其中引用或嵌入比赛文档。

让我们考虑以下映射游泳比赛和多种族关系的示例。如果您需要在另一个上下文中查看许多数据实体,这证明了嵌入优于引用的优势。在比赛和比赛数据之间的一对多关系中,比赛有多个比赛实体:

// db.competition schema
{
    "_id": 1,
    "name": "Utmanaren",
    "location": "town",
    "startdate": "20150627",
    "enddate": "20150627"
    "races": [
        {
            "gender" : "m"
            "style" : "freestyle"
            "length" : "100"
        },
        {           
            "gender" : "f"
            "style" : "butterfly"
            "length" : "50"
        }
    ]
}

借助嵌入式数据模型,您的应用程序只需一次查询即可检索到完整的游泳比赛信息。这种设计还有其他优点,其中之一就是数据局部性。由于 MongoDB 将数据连续存储在磁盘上,将您需要的所有数据放在一个文档中可确保旋转磁盘花费更少的时间来寻找磁盘上的特定位置。嵌入式文档的另一个优点是写入数据的原子性和隔离性。为了说明这一点,假设你想删除一个比赛 "style" 属性 的值为 "butterfly",这可以通过一个(原子)操作来完成:

db.competition.remove({"races.style": "butterfly"});

有关 MongoDB 中数据建模的更多详细信息,请阅读文档 Data Modeling Introduction, specifically Model One-to-Many Relationships with Embedded Documents

另一个设计选项是引用文档遵循规范化模式,其中竞赛文档包含对竞赛文档的引用:

// db.race schema
{
    "_id": 1,
    "competition_id": 1,
    "gender": "m",
    "style": "freestyle",
    "length": "100"
},
{
    "_id": 2,
    "competition_id": 1,
    "gender": "f",
    "style": "butterfly",
    "length": "50"
}

上述方法提高了执行查询的灵活性。例如,要检索主要父实体 competition 的 id 为 1 的所有子种族文档将很简单,只需针对集合 race:

创建一个查询
db.race.find({"competiton_id": 1});

上面使用文档引用方法的规范化模式在您具有非常不可预测的数量的一对多关系时也有优势。如果每个给定 competition 有成百上千个 race 文档,嵌入选项在空间约束方面有很多挫折,因为文档越大,它使用的 RAM 越多,并且 MongoDB 文档的硬大小限制为 16MB。

如果您的应用程序经常使用比赛信息检索比赛数据,那么您的应用程序需要发出多个查询来解析引用。

一般的经验法则是,如果您的应用程序的查询模式是众所周知的并且数据往往只以一种方式访问​​,那么嵌入式方法会很有效。如果您的应用程序以多种方式查询数据,或者您无法预测数据查询模式,则更规范化的文档引用模型将适用于这种情况。

参考:

MongoDB Applied Design Patterns: Practical Use Cases with the Leading NoSQL Database By Rick Copeland

将单个项目推入字段;

db.yourcollection.update( { $push: { "races": { "belongsTOId" : "1" , "gender" : "f" , "style" : "butterfly" , "length" : "50"} } } );

要将多个项目推送到字段中,它允许在字段中重复;

db.yourcollection.update( { $push: { "races": { $each: [ { "belongsTOId" : "1" , "gender" : "f" , "style" : "butterfly" , "length" : "50"}, { "belongsTOId" : "2" , "gender" : "m" , "style" : "horse" , "length" : "70"} ] } } } );

推送多个项目而不重复项目;

db.yourcollection.update( { $addToSet: { "races": { $each: [ { "belongsTOId" : "1" , "gender" : "f" , "style" : "butterfly" , "length" : "50"}, { "belongsTOId" : "2" , "gender" : "m" , "style" : "horse" , "length" : "70"} ] } } } );

$pushAll 自 2.4 版起已弃用,因此我们在 $push 中使用 $each 而不是 $pushAll.

在使用 $push 时,您将能够对项目进行排序和切片。您可以查看 mongodb manual.