Ruby- 在 O(log n) 运行时从排序的(唯一)数组中删除一个值

Ruby- delete a value from sorted (unique) array at O(log n) runtime

我有一个排序数组(唯一值,不重复)。

我知道我可以使用 Array#binarysearch 但它用于查找值而不是删除它们。 我也可以删除 O(log n) 处的值吗?怎么样?

假设我有这个数组:

arr = [-3, 4, 7, 12, 15, 20] #very long array

我想删除值 7。 到目前为止我有这个:

arr.delete(7) #I'm quite sure it's O(n)

假设 Array#delete-at 在 O(1) 下工作。 我可以 arr.delete_at(value_index) 现在我只需要获取值的索引。 二进制搜索可以做到这一点,因为数组已经排序。 但是唯一利用排序属性(据我所知)的方法是二进制搜索,其中 returns 值,与删除或返回索引无关。

总结一下:

1) 如何从 O(log n) 的已排序非重复数组中删除一个值?

或者

2) 假设 array#delete-at 在 O(1) 时工作​​(是吗?),我怎样才能在 O(log n) 时获得值的索引? (我的意思是数组已经排序了,我必须自己实现吗?)

谢谢。

标准数组实现对排序或重复没有限制。因此,默认实现必须以性能与灵活性进行权衡。

Array#delete 删除 O(n) 中的一个元素。 Here's the C implementation。注意循环

for (i1 = i2 = 0; i1 < RARRAY_LEN(ary); i1++) {
  ...
}

成本是合理的,因为 Ruby 必须扫描所有匹配给定值的项目(注意 delete 删除 all 匹配值的条目, 而不仅仅是第一个), 然后移动下一个项目以压缩数组。

delete_at 具有相同的成本。事实上,它按给定索引删除元素,但随后它使用 memmove 将数组中的剩余条目少移动一个索引。

使用二分查找不会改变成本。搜索将花费您 O(log n),但您需要删除给定键处的元素。在最坏的情况下,当元素位于 [0] 位置时,将内存中所有其他项目移动 1 个位置的成本将为 O(n).

在所有情况下,成本都是 O(n)。这并不意外。 Ruby 中的默认数组实现使用数组。这是因为,如前所述,没有可用于优化操作的特定约束。易于迭代和操作集合是优先事项。

数组、排序数组、列表和排序列表:这些数据结构都很灵活,但在某些特定操作中你付出了代价。

回到你的问题,如果你关心性能并且你的数组是有序且唯一的,你绝对可以利用它。如果您的主要目标是从数组中查找和删除项目,则有更好的数据结构。例如,您可以创建一个自定义 class,使用 d-heap where the delete() costs O(log[d,n]), same applies if you use a binomial heap.

在内部存储您的数组