matplotlib hexbin 归一化
matplotlib hexbin normalize
我想用 matplotlib 制作 x y 数据的多个 hexbin 密度图,类似于这个:
http://matplotlib.org/1.4.0/examples/pylab_examples/hexbin_demo.html
但我想将每个六边形的计数除以一个给定的数字(我的密度图中的最高峰值),这样我所有的密度图都会有相同的颜色,颜色条会是 [0,1 ] 所有地块的范围。
谁能告诉我一个可行的例子?
谢谢期待,
杰诺斯
我看到了两种可能的方法。
方法一
首先是调用 hexbin 获取最大值,然后使用 reduce_C_function
输入选项执行另一个 hexbin 调用以缩放数据。
执行归一化的问题在于,在创建 hexbin 之前,您不知道每个 bin 中有多少点。使用您链接到的示例中的数据(但仅创建线性比例图)这类似于:
plt.subplot(111)
hb = plt.hexbin(x,y, cmap=plt.cm.YlOrRd_r)
plt.cla()
plt.hexbin(x, y,
C=np.ones_like(y, dtype=np.float) / hb.get_array().max(),
cmap=plt.cm.YlOrRd_r,
reduce_C_function=np.sum)
plt.axis([xmin, xmax, ymin, ymax])
cb = plt.colorbar()
在第二个 hexbin 调用中,您必须提供 C
数组才能使用 reduce_C_function
选项。在这种情况下,C=np.ones_like(y) / hb.get_array().max()
就是您所需要的,因为您只需对这些值求和即可。
请注意,在第一次 hexbin 调用后清除轴可能是有意义的。
这种方法的一个问题是您将在没有点的地方有空箱(白色 space)。如果您希望背景颜色与零值相同,您可以添加 plt.gca().set_axis_bgcolor(plt.cm.YlOrRd_r(0))
.
方法二
另一种方法是简单地使用 hexbin 中固有的自动缩放,并简单地重新标记颜色条。例如:
plt.subplot(111)
hb = plt.hexbin(x,y, cmap=plt.cm.YlOrRd_r)
plt.axis([xmin, xmax, ymin, ymax])
cb = plt.colorbar()
cb.set_ticks(np.linspace(hb.get_array().min(), hb.get_array().max(), 6))
cb.set_ticklabels(np.linspace(0, 1., 6))
注意这里必须使用计数单位的颜色条刻度setter,然后你将标签设置在你想要的范围内。就个人而言,我更喜欢第二种方法,因为它更简洁一些,但我可以想象第一种方法更有用的情况。
@farenorth 的方法二很好。
也可以使用以下方法来获取 hexbin 密度图:
cb.set_ticks(np.linspace(hb.get_array().min(), hb.get_array().max(), 6))
cb.set_ticklabels(['%.4f'%x for x in np.linspace(hb.get_array().min()/hb.get_array().sum(), hb.get_array().max()/hb.get_array().sum(), 6)])
我想用 matplotlib 制作 x y 数据的多个 hexbin 密度图,类似于这个: http://matplotlib.org/1.4.0/examples/pylab_examples/hexbin_demo.html
但我想将每个六边形的计数除以一个给定的数字(我的密度图中的最高峰值),这样我所有的密度图都会有相同的颜色,颜色条会是 [0,1 ] 所有地块的范围。
谁能告诉我一个可行的例子?
谢谢期待,
杰诺斯
我看到了两种可能的方法。
方法一
首先是调用 hexbin 获取最大值,然后使用 reduce_C_function
输入选项执行另一个 hexbin 调用以缩放数据。
执行归一化的问题在于,在创建 hexbin 之前,您不知道每个 bin 中有多少点。使用您链接到的示例中的数据(但仅创建线性比例图)这类似于:
plt.subplot(111)
hb = plt.hexbin(x,y, cmap=plt.cm.YlOrRd_r)
plt.cla()
plt.hexbin(x, y,
C=np.ones_like(y, dtype=np.float) / hb.get_array().max(),
cmap=plt.cm.YlOrRd_r,
reduce_C_function=np.sum)
plt.axis([xmin, xmax, ymin, ymax])
cb = plt.colorbar()
在第二个 hexbin 调用中,您必须提供 C
数组才能使用 reduce_C_function
选项。在这种情况下,C=np.ones_like(y) / hb.get_array().max()
就是您所需要的,因为您只需对这些值求和即可。
请注意,在第一次 hexbin 调用后清除轴可能是有意义的。
这种方法的一个问题是您将在没有点的地方有空箱(白色 space)。如果您希望背景颜色与零值相同,您可以添加 plt.gca().set_axis_bgcolor(plt.cm.YlOrRd_r(0))
.
方法二
另一种方法是简单地使用 hexbin 中固有的自动缩放,并简单地重新标记颜色条。例如:
plt.subplot(111)
hb = plt.hexbin(x,y, cmap=plt.cm.YlOrRd_r)
plt.axis([xmin, xmax, ymin, ymax])
cb = plt.colorbar()
cb.set_ticks(np.linspace(hb.get_array().min(), hb.get_array().max(), 6))
cb.set_ticklabels(np.linspace(0, 1., 6))
注意这里必须使用计数单位的颜色条刻度setter,然后你将标签设置在你想要的范围内。就个人而言,我更喜欢第二种方法,因为它更简洁一些,但我可以想象第一种方法更有用的情况。
@farenorth 的方法二很好。 也可以使用以下方法来获取 hexbin 密度图:
cb.set_ticks(np.linspace(hb.get_array().min(), hb.get_array().max(), 6))
cb.set_ticklabels(['%.4f'%x for x in np.linspace(hb.get_array().min()/hb.get_array().sum(), hb.get_array().max()/hb.get_array().sum(), 6)])