Python中有没有按数据块打乱数据的函数?

Is there a function in Python that shuffle data by data blocks?

例如,至于

[1 2 3 4 5 6]

像以前一样在保持数据块(包括2个数据)的同时打乱数据。我们将获得:

[3 4 1 2 5 6]

Python有什么方法可以做到这一点?

您可以使用 random 模块并调用函数 random.shuffle() - 这将打乱列表中的每个元素,因此在打乱之前将您的列表分成子列表

import random, itertools

mylist = [1, 2, 3, 4, 5, 6]
blocks = [mylist[x:x+2] for x in range(0, len(mylist), 2)]
random.shuffle(blocks)
list(itertools.chain.from_iterable(blocks))
>> [3, 4, 1, 2, 5, 6]

一个简单的方法是使用以下三个步骤:

  1. 创建块(二维列表);
  2. 随机播放该列表;和
  3. 再次合并这些列表。

所以:

import random

# Import data
data = [1,2,3,4,5,6]
blocksize = 2

# Create blocks
blocks = [data[i:i+blocksize] for i in range(0,len(data),blocksize)]
# shuffle the blocks
random.shuffle(blocks)
# concatenate the shuffled blocks
data[:] = [b for bs in blocks for b in bs]

如果您不想将数据存储回 data,您可以简单地使用:

data = [b for bs in blocks for b in bs]

对于这个数据我得到:

>>> data
[3, 4, 1, 2, 5, 6]

第二次:

>>> data
[5, 6, 1, 2, 3, 4]

没有内置函数,但您可以编写一个小助手来为您完成此操作:

1- 创建块
2- 洗牌
3- 展平块和 return 得到的随机序列。

    import random

    def shuffle_by_blocks(seq, blocksize):
        blocks = [seq[idx*blocksize: (idx+1)*blocksize] for idx in range(len(seq)//blocksize)]
        random.shuffle(blocks)
        return [elt for block in blocks for elt in block ]

    shuffle_by_blocks([1,2,3,4,5,6], 2)

输出样本:

[1, 2, 5, 6, 3, 4]

最大限度地使用标准方法:

>>> import random, itertools
>>> a
[1, 2, 3, 4, 5, 6]

# group elements by 2
>>> grouped = list(zip(*[iter(a)]*2))
>>> grouped
[(1, 2), (3, 4), (5, 6)]

# shuffle groups
>>> random.shuffle(grouped)
>>> grouped
[(3, 4), (1, 2), (5, 6)]

# flatten groups to list
>>> list(itertools.chain.from_iterable(grouped))
[3, 4, 1, 2, 5, 6]

简单的方法

import random
data = [1,2,3,4,5,6]
temp = range(len(data)/2)
random.shuffle(temp)
data_c = data[:]
for i, j in enumerate(temp):
    if not i == j:
        data_c[i*2],data_c[(i*2)+1] = data[j*2],data[(j*2)+1]
print(data_c)

输出

[1, 2, 5, 6, 3, 4]

有人要求使用 numpy 的解决方案:

>>> import numpy as np
>>> a = np.array([1, 2, 3, 4, 5, 6])
>>> np.random.shuffle(a.reshape((-1, 2)))
>>> a
array([5, 6, 3, 4, 1, 2])

这会在原地打乱重塑后的视图,但 a 会保留其原始尺寸,因此无需重塑。