Python: 给语料库中的文档随机分配标题

Python: randomly assigning titles to documents in a corpus

我如何着手创建一个 n x 2 数组,以便主题分配是(尽可能接近)一个真正随机的过程?


编辑:

我不确定如何编写代码。对不起,如果解释有点含糊,但没有太多信息可以提供。我只是想要一种从 Z 映射到 D 随机 的方法(以获得 n x 2 数组 不是一个n x m数组,诚实的错误)。

我想这就是你想要的。

>>> D = [1,2,3,4,5,6,7,8,9]
>>> Z = ['a','b','c','d','e','f','g']
>>> [[i, random.choice(Z)] for i in D]
[[1, 'a'], [2, 'd'], [3, 'c'], [4, 'f'], [5, 'b'], [6, 'g'], [7, 'f'], [8, 'f'], [9, 'f']]

此列表理解遍历 D(您的语料库)并将每个元素与 Z(您的主题)的随机元素相匹配。

元组可能比单个对的列表更好,因为它们更常用于表示不同事物的集合 - 请参阅 this 何时使用列表与元组的回答。