MongoDB

Question

我在 python 中使用 mongo 引擎。为了声明我的模型，我有以下代码：

class Subject(Document):
    uri = StringField(required=True,unique=True)
    resources = ListField(ReferenceField('Resource'))
    meta = {
        'indexes': [
            {'fields': ['uri'], 'unique': True},
        ],
    }

我想检查索引是否按预期创建/工作，所以我去了 mongo 并执行了：

db.subject.find({uri:'http://dbpedia.org/resource/Napoleon'}).explain()

该命令的输出如下：

{
    "cursor" : "BtreeCursor uri_1",
    "isMultiKey" : false,
    "n" : 1,
    "nscannedObjects" : 1,
    "nscanned" : 1,
    "nscannedObjectsAllPlans" : 1,
    "nscannedAllPlans" : 1,
    "scanAndOrder" : false,
    "indexOnly" : false,
    "nYields" : 0,
    "nChunkSkips" : 0,
    "millis" : 0,
    "indexBounds" : {
        "uri" : [
            [
                "http://dbpedia.org/resource/Napoleon",
                "http://dbpedia.org/resource/Napoleon"
            ]
        ]
    },
    "server" : "ioannis-linux:27017",
    "filterSet" : false
}

我在查看 mongodb 文档时无法理解的是，为什么我们在 indexBounds 中得到两个具有相同 uri 索引的条目。这是什么意思？这发生在我查找的任何 URI 上。

更新

不确定这是否相关，但我有另一个域 class 也使用与索引相同的 URI..(Resource)

Answer 1

解释很简单。这些是边界——下限和上限。如果它们相等，那么您正在搜索一个精确的字符串。

你也可以这样做

db.subject.find({uri: { $gte: 'http://dbpedia.org/resource/Napoleon', 
                        $lte: 'http://dbpedia.org/resource/Putin' 
                }).explain()

（尽管它在您的情况下没有多大意义，但在其他地方可能会有用），这将导致不同的界限，从而产生范围结果。

我想说这背后的原因是简化。您无需使用不同的字段来描述精确搜索和范围搜索，而是可以同时表达两者。

Answer 2

这很正常，因为您在 uri 上有一个唯一索引，并且您在该索引上查询单个文档。 explain 上的 indexBounds 告诉您的是，为了检索此特定文档，它扫描了从该索引的 [lower, upper] 边界开始的索引，在这种情况下恰好相同，因为您在查询中指定了单个文档。 nscanned = 1 也验证了这一点。

如果您想查看不同的边界，请尝试将正则表达式指定为以下查询：{uri: {$regex:'^"http://dbpedia*'}} 那么它可能必须扫描更多文档，您将在 explain() 中获得不同的 [upper, lower] 边界

MongoDB - 了解索引 - db.explain

MongoDB - Understanding Indexes - db.explain

mongoengine

flask-mongoengine