heapq 成员测试和替换

heapq membership test and replacement

以官方heapq为例:

>>> heap = []
>>> data = [(1, 'J'), (4, 'N'), (3, 'H'), (2, 'O')]
>>> for item in data:
...     heappush(heap, item)
...
>>> while heap:
...     print(heappop(heap)[1])
J
O
H
N

我想进一步实施高效的 selective_push 这样

  1. selective_push((1, 'M')) 等同于 heappush 因为 'M' 不在堆中
  2. selective_push((3.5, 'N')) 等价于heap[2]= (3.5, 'N');自 3.5<4
  3. 起堆化(堆)
  4. selective_push((4.5, 'N')) 自 4.5>4
  5. 起什么都不做

以下实现解释了目标但速度很慢:

def selective_push(heap,s):
   NotFound=True
   for i in range(len(heap)): #linear search
        if heap[i][1]==s[1]:
            if s[0]<heap[i][0]:
                 heap[i]=s      #replacement
                 heapify(heap)
            NotFound=False
            break
    if NotFound:
       heappush(heap,s)

我认为由于线性搜索它很慢,这破坏了 heapq.push 的 log(n) 复杂度。替换率低,但一​​直执行线性搜索

heapq docs 有一个如何更改现有项目优先级的示例。 (该示例还使用 count 来确保具有相同优先级的项目以与添加它们时相同的顺序返回:由于您没有提到这是一项要求,我通过删除它简化了代码部分。)我还添加了您提到的与替换现有项目时相关的逻辑。

本质上它归结为维护一个字典(entry_finder)以快速查找项目,并将项目标记为已删除而不立即将它们从堆中删除,并在弹出时跳过标记的项目来自堆。

pq = []                         # list of entries arranged in a heap
entry_finder = {}               # mapping of tasks to entries
REMOVED = '<removed-task>'      # placeholder for a removed task

def add_task(task, priority=0):
    'Add a new task or update the priority of an existing task'
    if task in entry_finder:
        old_priority, _ = entry_finder[task]
        if priority < old_priority:
            # new priority is lower, so replace
            remove_task(task)
        else:
            # new priority is same or higher, so ignore
            return
    entry = [priority, task]
    entry_finder[task] = entry
    heappush(pq, entry)

def remove_task(task):
    'Mark an existing task as REMOVED.  Raise KeyError if not found.'
    entry = entry_finder.pop(task)
    entry[-1] = REMOVED

def pop_task():
    'Remove and return the lowest priority task. Raise KeyError if empty.'
    while pq:
        priority, task = heappop(pq)
        if task is not REMOVED:
            del entry_finder[task]
            return task
    raise KeyError('pop from an empty priority queue')

一些注意事项:

  • heappush 是高效的,因为它可以假设被推送到的列表已经被排序为堆; heapify每次调用都要检查所有元素

  • 并没有真正删除项目,只是将它们标记为已删除,速度很快,但确实意味着如果您要重置很多优先级,那么实际上会浪费一些存储空间;这是否合适取决于您的用例

  • 您需要为您要使用的任何其他 heapq 函数创建类似的包装器,因为您始终需要确保 entry_finder 查找字典与heapq

  • 中的数据保持同步