使用假设 Python 生成条件数据

generating conditional data with Hypothesis Python

我想根据以下条件生成一个大小为 2 的整数列表列表。

我可以用自定义函数生成每个元组,但不知道如何使用它来满足第二个条件。

from hypothesis import strategies as st

@st.composite
def generate_data(draw):
    min_val, max_val = draw(st.lists(st.integers(1, 1e2), min_size=2, max_size=2))
    st.assume(min_val < max_val)
    return [min_val, max_val]

我可以通过以这种(低效?)方式迭代 generate_date 几次来生成数据:

>>> [generate_data().example() for _ in range(3)]
    [[5, 31], [1, 12], [33, 87]]

但是如何检查数据是否唯一?

例如,以下值无效:

[[1, 2], [1, 5], ...]  # (1 is repeated)
[[1, 2], [1, 2], ...]  # (repeated data)

但以下内容有效:

[[1, 2], [3, 4], ...]

我认为以下策略可以满足您的要求:

import hypothesis.strategies as st

@st.composite
def unique_pair_lists(draw):
    data = draw(st.lists(st.integers(), unique=True)
    if len(data) % 2 != 0:
        data.pop()
    result = [data[i:i+2] for i in range(0, len(data), 2)]
    for pair in result:
        pair.sort()
    return result

这里的想法是,我们生成具有正确元素的东西,然后将其转换为正确形状的东西。我们不是试图生成成对的整数列表,而是生成一个唯一整数列表,然后将它们分组成对(如果有奇数个整数,我们将删除最后一个元素)。然后我们对每一对进行排序以确保其顺序正确。

David 的解决方案允许一个整数出现在两个子列表中 - 对于完全唯一的整数,我将使用以下内容:

@st.composite
def list_of_pairs_of_unique_elements(draw):
    seen = set()
    new_int = st.integers(1, 1e2)\
        .filter(lambda n: n not in seen)\  # Check that it's unique
        .map(lambda n: seen.add(n) or n)   # Add to filter before next draw
    return draw(st.lists(st.tuples(new_int, new_int).map(sorted))
  • .filter(...) 方法可能就是您要找的。
  • .example() 仅供交互使用 - 如果您在 @given().
  • 中使用它,您将收到警告(或错误)
  • 如果您可能最终过滤掉范围内的大部分元素(例如,长度 > 30 的外部列表,意味着 60/100 个可能的唯一元素),您可能会通过创建可能元素的列表并弹出来获得更好的性能它而不是拒绝看到的元素。