这个桶排序实现在做什么?

What is this bucket sort implementation doing?

这是我在 Python 中的桶排序代码。

from random import randrange


def insertion_sort(aList):
    for i in range(1, len(aList)):
        for j in range(i, 0, -1):
            if aList[j] < aList[j-1]:
                aList[j], aList[j-1] = aList[j-1], aList[j]
    return aList

def bucket_sort(aList):
    buckets =  [[]] * len(aList)
    for index, value in enumerate(aList):
        buckets_index = value * len(aList) // (max(aList) + 1)
        buckets[buckets_index].append(value)

answer = []

for bucket in buckets:
    answer.extend(insertion_sort(bucket))
    # answer += insertion_sort(bucket)

print(buckets[0])
print("\n")
# return answer


aList = [randrange(10) for _ in range(100)]
print(aList)
print("\n")
answer = bucket_sort(aList)
#print(answer)

这是怎么回事?当我 运行 代码时,我总是发现 buckets 中的第一个列表已经排序并且 buckets 中的其他列表都是它的副本。 每个列表都需要插入排序吗? "answer" 变量有什么用?!

我主要靠this visualization

我马上注意到的一件事是您将变量桶初始化为 buckets = [[]] * len(aList)。这会生成空列表的相同副本列表。因此,此列表的任何修改都会复制到 buckets 的每个元素中。将此行更改为:

buckets =  [[] for _ in xrange(len(aList))]

要检查列表中的列表是否是单独的对象,您可以检查它们的 id:

print [id(x) for x in buckets]

这应该打印一个唯一编号列表。

我认为这种桶排序会更有效率并且更符合 Python 风格。

def bucket(k):
    unique = list(set(k))
    values = [k.count(uni) for uni in unique]
    result = ([unique[uni] for i in range(values[uni])] for uni in range(len(unique)))
    result = sum(result, [])
    return result