matplotlib hexbin 归一化

matplotlib hexbin normalize

我想用 matplotlib 制作 x y 数据的多个 hexbin 密度图,类似于这个: http://matplotlib.org/1.4.0/examples/pylab_examples/hexbin_demo.html

但我想将每个六边形的计数除以一个给定的数字(我的密度图中的最高峰值),这样我所有的密度图都会有相同的颜色,颜色条会是 [0,1 ] 所有地块的范围。

谁能告诉我一个可行的例子?

谢谢期待,

杰诺斯

我看到了两种可能的方法。

方法一

首先是调用 hexbin 获取最大值,然后使用 reduce_C_function 输入选项执行另一个 hexbin 调用以缩放数据。 执行归一化的问题在于,在创建 hexbin 之前,您不知道每个 bin 中有多少点。使用您链接到的示例中的数据(但仅创建线性比例图)这类似于:

plt.subplot(111)
hb = plt.hexbin(x,y, cmap=plt.cm.YlOrRd_r)
plt.cla()
plt.hexbin(x, y,
           C=np.ones_like(y, dtype=np.float) / hb.get_array().max(),
           cmap=plt.cm.YlOrRd_r,
           reduce_C_function=np.sum)
plt.axis([xmin, xmax, ymin, ymax])
cb = plt.colorbar()

在第二个 hexbin 调用中,您必须提供 C 数组才能使用 reduce_C_function 选项。在这种情况下,C=np.ones_like(y) / hb.get_array().max() 就是您所需要的,因为您只需对这些值求和即可。

请注意,在第一次 hexbin 调用后清除轴可能是有意义的。

这种方法的一个问题是您将在没有点的地方有空箱(白色 space)。如果您希望背景颜色与零值相同,您可以添加 plt.gca().set_axis_bgcolor(plt.cm.YlOrRd_r(0)).

方法二

另一种方法是简单地使用 hexbin 中固有的自动缩放,并简单地重新标记颜色条。例如:

plt.subplot(111)
hb = plt.hexbin(x,y, cmap=plt.cm.YlOrRd_r)
plt.axis([xmin, xmax, ymin, ymax])
cb = plt.colorbar()
cb.set_ticks(np.linspace(hb.get_array().min(), hb.get_array().max(), 6))
cb.set_ticklabels(np.linspace(0, 1., 6))

注意这里必须使用计数单位的颜色条刻度setter,然后你将标签设置在你想要的范围内。就个人而言,我更喜欢第二种方法,因为它更简洁一些,但我可以想象第一种方法更有用的情况。

@farenorth 的方法二很好。 也可以使用以下方法来获取 hexbin 密度图:

cb.set_ticks(np.linspace(hb.get_array().min(), hb.get_array().max(), 6))
cb.set_ticklabels(['%.4f'%x for x in np.linspace(hb.get_array().min()/hb.get_array().sum(), hb.get_array().max()/hb.get_array().sum(), 6)])