随机生成相似的向量?
Randomly generate similar vectors?
我有以下向量:
import numpy as np
my_vector = np.array([0.001, -0.05, 0.3, 0.5, 0.01, -0.03])
有人可以建议一种方法来随机生成相似的向量,只是值略有不同吗?例如,所需的输出是:
[0.002, -0.06, 0.2, 0.4, 0.02, -0.02]
为了提供一些背景信息,此向量表示我输入分类模型的样本。我的计划是随机生成一组相似的样本,并将它们输入同一个模型,以观察其输出的变化。最终目标是验证模型是否为相似的样本生成相似的输出。
我尝试并将我想要的余弦相似度设置为1,但是用这种方法我只能得到一个相似向量(见下文)。我至少需要 10 个。
def rand_cos_sim(v, costheta):
# Form the unit vector parallel to v:
u = v / np.linalg.norm(v)
# Pick a random vector:
r = np.random.multivariate_normal(np.zeros_like(v), np.eye(len(v)))
# Form a vector perpendicular to v:
uperp = r - r.dot(u)*u
# Make it a unit vector:
uperp = uperp / np.linalg.norm(uperp)
# w is the linear combination of u and uperp with coefficients costheta
# and sin(theta) = sqrt(1 - costheta**2), respectively:
w = costheta*u + np.sqrt(1 - costheta**2)*uperp
return w
new_vector = rand_cos_sim(my_vector, 1)
print(new_vector)
# [ 0.00170622 -0.08531119 0.51186714 0.8531119 0.01706224 -0.05118671]
我脑子里没有特定的相似性度量,它可以是欧几里德、余弦,以效果最好的为准。欢迎任何建议。
请注意,我提供的 my_vector
仅用于说明目的,实际上我的向量将具有不同的值范围,具体取决于我正在测试的模型和不同的数据。
谢谢。
也许我过于简单化了,但你能不能只生成与你的大小相同的随机向量,然后将它们添加到你的向量中以使其相似(或者添加一个,然后相乘,因为你的示例似乎在较小的数字)?
def similar_vector(my_vector):
return (0.95+numpy.random.rand(len(my_vector))*0.1)*my_vector
我认为最好的方法是在两个值之间添加一个随机数。为此目的研究随机。
import numpy as np
import random
my_vector = np.array([0.001, -0.05, 0.3, 0.5, 0.01, -0.03])
for i in range(len(my_vector)):
my_vector[i] += random.uniform(.001,.1)
print(my_vector)
您可以通过调整值范围来调整它
您可以通过调用 numpy.random.lognormal
生成随机乘法因子。使用 mean=0
和较小的值 sigma
生成接近 1 的随机值。
例如,
In [23]: my_vector = np.array([0.001, -0.05, 0.3, 0.5, 0.01, -0.03])
In [24]: a = np.random.lognormal(sigma=0.1, size=my_vector.shape)
In [25]: a
Out[25]:
array([1.07162745, 0.99891183, 1.02511718, 0.85346562, 1.04191125,
0.87158183])
In [26]: a * my_vector
Out[26]:
array([ 0.00107163, -0.04994559, 0.30753516, 0.42673281, 0.01041911,
-0.02614745])
我有以下向量:
import numpy as np
my_vector = np.array([0.001, -0.05, 0.3, 0.5, 0.01, -0.03])
有人可以建议一种方法来随机生成相似的向量,只是值略有不同吗?例如,所需的输出是:
[0.002, -0.06, 0.2, 0.4, 0.02, -0.02]
为了提供一些背景信息,此向量表示我输入分类模型的样本。我的计划是随机生成一组相似的样本,并将它们输入同一个模型,以观察其输出的变化。最终目标是验证模型是否为相似的样本生成相似的输出。
我尝试
def rand_cos_sim(v, costheta):
# Form the unit vector parallel to v:
u = v / np.linalg.norm(v)
# Pick a random vector:
r = np.random.multivariate_normal(np.zeros_like(v), np.eye(len(v)))
# Form a vector perpendicular to v:
uperp = r - r.dot(u)*u
# Make it a unit vector:
uperp = uperp / np.linalg.norm(uperp)
# w is the linear combination of u and uperp with coefficients costheta
# and sin(theta) = sqrt(1 - costheta**2), respectively:
w = costheta*u + np.sqrt(1 - costheta**2)*uperp
return w
new_vector = rand_cos_sim(my_vector, 1)
print(new_vector)
# [ 0.00170622 -0.08531119 0.51186714 0.8531119 0.01706224 -0.05118671]
我脑子里没有特定的相似性度量,它可以是欧几里德、余弦,以效果最好的为准。欢迎任何建议。
请注意,我提供的 my_vector
仅用于说明目的,实际上我的向量将具有不同的值范围,具体取决于我正在测试的模型和不同的数据。
谢谢。
也许我过于简单化了,但你能不能只生成与你的大小相同的随机向量,然后将它们添加到你的向量中以使其相似(或者添加一个,然后相乘,因为你的示例似乎在较小的数字)?
def similar_vector(my_vector):
return (0.95+numpy.random.rand(len(my_vector))*0.1)*my_vector
我认为最好的方法是在两个值之间添加一个随机数。为此目的研究随机。
import numpy as np
import random
my_vector = np.array([0.001, -0.05, 0.3, 0.5, 0.01, -0.03])
for i in range(len(my_vector)):
my_vector[i] += random.uniform(.001,.1)
print(my_vector)
您可以通过调整值范围来调整它
您可以通过调用 numpy.random.lognormal
生成随机乘法因子。使用 mean=0
和较小的值 sigma
生成接近 1 的随机值。
例如,
In [23]: my_vector = np.array([0.001, -0.05, 0.3, 0.5, 0.01, -0.03])
In [24]: a = np.random.lognormal(sigma=0.1, size=my_vector.shape)
In [25]: a
Out[25]:
array([1.07162745, 0.99891183, 1.02511718, 0.85346562, 1.04191125,
0.87158183])
In [26]: a * my_vector
Out[26]:
array([ 0.00107163, -0.04994559, 0.30753516, 0.42673281, 0.01041911,
-0.02614745])