Ruby- 在 O(log n) 运行时从排序的（唯一）数组中删除一个值

Question

我有一个排序数组（唯一值，不重复）。

我知道我可以使用 Array#binarysearch 但它用于查找值而不是删除它们。我也可以删除 O(log n) 处的值吗？怎么样？

假设我有这个数组：

arr = [-3, 4, 7, 12, 15, 20] #very long array

我想删除值 7。到目前为止我有这个：

arr.delete(7) #I'm quite sure it's O(n)

假设 Array#delete-at 在 O(1) 下工作。我可以 arr.delete_at(value_index) 现在我只需要获取值的索引。二进制搜索可以做到这一点，因为数组已经排序。但是唯一利用排序属性（据我所知）的方法是二进制搜索，其中 returns 值，与删除或返回索引无关。

总结一下：

1) 如何从 O(log n) 的已排序非重复数组中删除一个值？

或者

2) 假设 array#delete-at 在 O(1) 时工作（是吗？），我怎样才能在 O(log n) 时获得值的索引？（我的意思是数组已经排序了，我必须自己实现吗？）

谢谢。

Answer 1

标准数组实现对排序或重复没有限制。因此，默认实现必须以性能与灵活性进行权衡。

Array#delete 删除 O(n) 中的一个元素。 Here's the C implementation。注意循环

for (i1 = i2 = 0; i1 < RARRAY_LEN(ary); i1++) {
  ...
}

成本是合理的，因为 Ruby 必须扫描所有匹配给定值的项目（注意 delete 删除 all 匹配值的条目, 而不仅仅是第一个), 然后移动下一个项目以压缩数组。

delete_at 具有相同的成本。事实上，它按给定索引删除元素，但随后它使用 memmove 将数组中的剩余条目少移动一个索引。

使用二分查找不会改变成本。搜索将花费您 O(log n)，但您需要删除给定键处的元素。在最坏的情况下，当元素位于 [0] 位置时，将内存中所有其他项目移动 1 个位置的成本将为 O(n).

在所有情况下，成本都是 O(n)。这并不意外。 Ruby 中的默认数组实现使用数组。这是因为，如前所述，没有可用于优化操作的特定约束。易于迭代和操作集合是优先事项。

数组、排序数组、列表和排序列表：这些数据结构都很灵活，但在某些特定操作中你付出了代价。

回到你的问题，如果你关心性能并且你的数组是有序且唯一的，你绝对可以利用它。如果您的主要目标是从数组中查找和删除项目，则有更好的数据结构。例如，您可以创建一个自定义 class，使用 d-heap where the delete() costs O(log[d,n]), same applies if you use a binomial heap.

在内部存储您的数组

Ruby- 在 O(log n) 运行时从排序的（唯一）数组中删除一个值

Ruby- delete a value from sorted (unique) array at O(log n) runtime

ruby

arrays

big-o