在 Python 中使用 Count-in-Cells 在 3D 星域中进行聚类

Clustering in a 3D star-field using Count-in-Cells in Python

第一次发帖,找不到任何能完全解决我的问题的东西。

我正在为我的硕士项目模拟银河殖民。我正在尝试做的一件事是查看模拟结束后遗留下来的未殖民恒星的空隙,看看是否存在超过统计波动的聚类行为。由于这是一个蒙特卡洛数值问题,相关函数并不是很合适,所以我使用通常用于观察星系团的细胞计数方法。

所以我在笛卡尔坐标系中工作

data = np.genfromtxt('counts.csv') # positions of uncolonsed stars
x = data[:,0]
y = data[:,1]
z = data[:,2]

我想做的是用不同大小的方框来统计方框内的星星数量,并与平均值进行比较,并对结果进行统计。

我的方向是查看某种 3D 直方图,例如看到的气泡图 here。我试过了,它似乎并没有将我所有的数据装箱,我不确定为什么,即立方体的 'floor' 有 'bubbles' 但大部分 'roof'一无所有:

当您查看绘制的原始星域时,这显然是错误的:

z 值较高的 bin 似乎没有保存任何数据。这可能是一个非常简单的问题,但我需要一些比我更擅长 python 的新眼光和头脑。

谁能想到如何解决这个问题?另外我想找到一种方法来计算每个盒子的点数,即每个箱子。

对不起,如果我有点模糊,但我很感激你们中的任何好人可以提供给我的任何帮助。

谢谢好友!

在评论中,您有一些替代方法可以解决您的问题,并且很难在没有看到代码的情况下说出您的代码有什么问题。在任何情况下,这类问题通常都可以通过对规则网格内的数据进行计数来解决(尽管如此,这是制作直方图的一般方法)。

构建自己的网格的优势在于,您可以立即知道每个 "sector" 的位置、起点和终点。因此,如果您想尝试,我建议您使用以下方法作为替代方法。

import numpy as np
from mpl_toolkits.mplot3d import Axes3D
import matplotlib.pyplot as plt

# Generating some random data.
data = np.random.randint(0, 100, (1000,3))
x, y, z = data[:, 0], data[:, 1], data[:, 2]

# Generating raw view
fig = plt.figure()
ax = fig.add_subplot(111, projection='3d')
ax.scatter(x, y, z, marker='+', s=25, c='r')
plt.show()

# Generating some grid with origin, cell size, and number of cells 10 10 10
numx, numy, numz = 5, 5, 5
origx, origy, origz = 0, 0, 0
sizex, sizey, sizez = 20, 20, 20
grid = np.vstack(np.meshgrid(range(numx), range(numy), range(numz))).reshape(3, -1).T
gx, gy, gz = grid[:, 0]*sizex + origx, grid[:, 1]*sizey + origy, grid[:, 2]*sizez + origz

# Calculating the number of stars in each cell:
ix = ((x - origx)/sizex).astype(int)
iy = ((y - origy)/sizey).astype(int)
iz = ((z - origz)/sizez).astype(int)
s = np.zeros((numx, numy, numz))
for i in range(ix.shape[0]):
    s[ix[i], iy[i], iz[i]] = s[ix[i], iy[i], iz[i]] + 1
s = s.flatten()
mask = s > 0

# Plotting the result
fig = plt.figure()
ax = fig.add_subplot(111, projection='3d')
ax.scatter(gx[mask], gy[mask], gz[mask], marker='o', s=s[mask]*100, c='b', edgecolor ="r")
plt.show()

随机数据的结果是这样的: