MongoDB 中的自定义索引比较器

Custom index comparator in MongoDB

我正在处理由与随机样本无法区分的概率加密元素组成的数据集。这样,相同数字的顺序加密会产生不同的密文。然而,这些仍然可以通过一个特殊的函数来比较,该函数应用 SHA256 等算法来比较两个密文。

我想将所描述的密文列表添加到 MongoDB 数据库中,并使用基于树的结构(即:AVL)对其进行索引。我不能简单地应用数据库的默认索引,因为如前所述,记录必须使用特殊函数进行比较。

一个例子:假设我有一个数据库db和一个由以下文档类型组成的集合c

{
  "_id":ObjectId,
  "r":string
}

另外,令F(int,string,string)为以下函数:

F(h,l,r) = ( SHA256(l | r) + h ) % 3

运算符在哪里|是一个标准的串联函数。

我想以高效的方式执行以下查询,例如在具有某些合适索引的集合中:

db.c.find( { F(h,l,r) :{ $eq: 0 } } )

h 和 l 是任意选择的,但不是常量。即:假设我想为某些对 (h1, l1) 找到满足 F(h1,l1,r) 的所有记录。稍后,在另一时刻,我想做同样的事情,但使用 (h2, l2) 使得 h1 != h2 和 l1 != l2。 h 和 l 可以取整数集中的任何值。

我该怎么做?

我尝试了一种将函数结果存储在您的集合中的解决方案,因此我更改了架构,如下所示:

{
  "_id": ObjectId,
  "r": {
    "_key": F(H, L, value),
    "value": String
  }
}

字段 r._keyF(h,l,r) 的值 constant hl,字段 r.value 是原始的 r 字段。 所以你可以在字段 r._key 上创建索引,你的查询条件将是:

db.c.find( { "r._key" : 0 } )

您可以使用运算符 $where 执行此查询,但这种方式不能使用索引。因此,查询性能取决于数据集的大小。

db.c.find({$where: function() { return F(1, "bb", this.r) == 0; }})

在执行上面的代码之前,您需要将函数 F 存储在 mongodb 服务器上:

db.system.js.save({
    _id: "F",
    value: function(h, l, r) {
        // the body of function
    }
})

链接: