heapq 成员测试和替换
heapq membership test and replacement
以官方heapq为例:
>>> heap = []
>>> data = [(1, 'J'), (4, 'N'), (3, 'H'), (2, 'O')]
>>> for item in data:
... heappush(heap, item)
...
>>> while heap:
... print(heappop(heap)[1])
J
O
H
N
我想进一步实施高效的 selective_push 这样
- selective_push((1, 'M')) 等同于 heappush 因为 'M' 不在堆中
- selective_push((3.5, 'N')) 等价于heap[2]= (3.5, 'N');自 3.5<4
起堆化(堆)
- selective_push((4.5, 'N')) 自 4.5>4
起什么都不做
以下实现解释了目标但速度很慢:
def selective_push(heap,s):
NotFound=True
for i in range(len(heap)): #linear search
if heap[i][1]==s[1]:
if s[0]<heap[i][0]:
heap[i]=s #replacement
heapify(heap)
NotFound=False
break
if NotFound:
heappush(heap,s)
我认为由于线性搜索它很慢,这破坏了 heapq.push
的 log(n) 复杂度。替换率低,但一直执行线性搜索
heapq
docs 有一个如何更改现有项目优先级的示例。 (该示例还使用 count
来确保具有相同优先级的项目以与添加它们时相同的顺序返回:由于您没有提到这是一项要求,我通过删除它简化了代码部分。)我还添加了您提到的与替换现有项目时相关的逻辑。
本质上它归结为维护一个字典(entry_finder
)以快速查找项目,并将项目标记为已删除而不立即将它们从堆中删除,并在弹出时跳过标记的项目来自堆。
pq = [] # list of entries arranged in a heap
entry_finder = {} # mapping of tasks to entries
REMOVED = '<removed-task>' # placeholder for a removed task
def add_task(task, priority=0):
'Add a new task or update the priority of an existing task'
if task in entry_finder:
old_priority, _ = entry_finder[task]
if priority < old_priority:
# new priority is lower, so replace
remove_task(task)
else:
# new priority is same or higher, so ignore
return
entry = [priority, task]
entry_finder[task] = entry
heappush(pq, entry)
def remove_task(task):
'Mark an existing task as REMOVED. Raise KeyError if not found.'
entry = entry_finder.pop(task)
entry[-1] = REMOVED
def pop_task():
'Remove and return the lowest priority task. Raise KeyError if empty.'
while pq:
priority, task = heappop(pq)
if task is not REMOVED:
del entry_finder[task]
return task
raise KeyError('pop from an empty priority queue')
一些注意事项:
heappush
是高效的,因为它可以假设被推送到的列表已经被排序为堆; heapify
每次调用都要检查所有元素
并没有真正删除项目,只是将它们标记为已删除,速度很快,但确实意味着如果您要重置很多优先级,那么实际上会浪费一些存储空间;这是否合适取决于您的用例
您需要为您要使用的任何其他 heapq
函数创建类似的包装器,因为您始终需要确保 entry_finder
查找字典与heapq
中的数据保持同步
以官方heapq为例:
>>> heap = []
>>> data = [(1, 'J'), (4, 'N'), (3, 'H'), (2, 'O')]
>>> for item in data:
... heappush(heap, item)
...
>>> while heap:
... print(heappop(heap)[1])
J
O
H
N
我想进一步实施高效的 selective_push 这样
- selective_push((1, 'M')) 等同于 heappush 因为 'M' 不在堆中
- selective_push((3.5, 'N')) 等价于heap[2]= (3.5, 'N');自 3.5<4 起堆化(堆)
- selective_push((4.5, 'N')) 自 4.5>4 起什么都不做
以下实现解释了目标但速度很慢:
def selective_push(heap,s):
NotFound=True
for i in range(len(heap)): #linear search
if heap[i][1]==s[1]:
if s[0]<heap[i][0]:
heap[i]=s #replacement
heapify(heap)
NotFound=False
break
if NotFound:
heappush(heap,s)
我认为由于线性搜索它很慢,这破坏了 heapq.push
的 log(n) 复杂度。替换率低,但一直执行线性搜索
heapq
docs 有一个如何更改现有项目优先级的示例。 (该示例还使用 count
来确保具有相同优先级的项目以与添加它们时相同的顺序返回:由于您没有提到这是一项要求,我通过删除它简化了代码部分。)我还添加了您提到的与替换现有项目时相关的逻辑。
本质上它归结为维护一个字典(entry_finder
)以快速查找项目,并将项目标记为已删除而不立即将它们从堆中删除,并在弹出时跳过标记的项目来自堆。
pq = [] # list of entries arranged in a heap
entry_finder = {} # mapping of tasks to entries
REMOVED = '<removed-task>' # placeholder for a removed task
def add_task(task, priority=0):
'Add a new task or update the priority of an existing task'
if task in entry_finder:
old_priority, _ = entry_finder[task]
if priority < old_priority:
# new priority is lower, so replace
remove_task(task)
else:
# new priority is same or higher, so ignore
return
entry = [priority, task]
entry_finder[task] = entry
heappush(pq, entry)
def remove_task(task):
'Mark an existing task as REMOVED. Raise KeyError if not found.'
entry = entry_finder.pop(task)
entry[-1] = REMOVED
def pop_task():
'Remove and return the lowest priority task. Raise KeyError if empty.'
while pq:
priority, task = heappop(pq)
if task is not REMOVED:
del entry_finder[task]
return task
raise KeyError('pop from an empty priority queue')
一些注意事项:
heappush
是高效的,因为它可以假设被推送到的列表已经被排序为堆;heapify
每次调用都要检查所有元素并没有真正删除项目,只是将它们标记为已删除,速度很快,但确实意味着如果您要重置很多优先级,那么实际上会浪费一些存储空间;这是否合适取决于您的用例
您需要为您要使用的任何其他
heapq
函数创建类似的包装器,因为您始终需要确保entry_finder
查找字典与heapq 中的数据保持同步