使用 Python 为 k-NN 中的二元分类生成数据集

Generate dataset for Binary Classification in k-NN using Python

我想生成具有 2 个标签 01 的随机数据集。这是我的分布:

p(x|y = 0) = N(x1;µ1,σ2 1)N(x2;µ2,σ2 2) 
p(x|y = 1) = N(x1;µ3,σ2 3)N(x2;µ4,σ2 4) 

其中 x=(x1,x2)T 包含两个连续值属性。

如何用python解决?我应该使用什么图书馆?谢谢

有很多种可能,最简单的可能就是用numpy random number generator,这样

import numpy as np
N = 100

mean1, mean2, std1, std2 = 1, 5, 2, 3
x0 = np.random.normal(loc=[mean1, mean2], scale=[std1, std2], size=(N, 2))

mean3, mean4, std3, std4 = 2, -2, 1, 0.1
x1 = np.random.normal(loc=[mean3, mean4], scale=[std3, std4], size=(N, 2))