Python Altair 如何在不更改轴刻度的情况下对直方图数据进行分类

Python Altair How Do I Bin Histogram Data without Changing the Axis Ticks

在 altair 中,如何在不改变轴刻度的情况下制作直方图?当我尝试对数据进行分箱时,轴刻度不再超出直方图中的数据。我希望单独计算 bin 和轴刻度。

下面的代码是一个简单的示例,它试图显示测量的公差范围内的限制,以查看有多少测量通过与失败。

import numpy as np
import pandas as pd
import altair as alt



nominal = 0.500
tolerance = 0.011
limits = pd.DataFrame({'x_limits' : [nominal - tolerance, nominal + tolerance]})

data = pd.DataFrame({'x_data' : np.random.normal(0.520, 0.002, 100)})



layers = []

layers.append(alt.Chart(data)
         .mark_bar()
         .encode(x = alt.X('x_data', bin = alt.Bin(nice = False)), y = 'count()'))

layers.append(alt.Chart(limits)
         .mark_rule()
         .encode(x = 'x_limits'))

chart = alt.layer(*layers)

输出仅在直方图 bin 下显示 X 轴上的刻度,并且它们在公差限制的规则之前停止。

对于分箱轴,我相信您需要设置分箱的范围来控制轴标签。在这种情况下,设置 alt.Bin(maxbins=50, extent=(0.48, 0.54))) 会得到:

我能够通过使用 mark_rect 而不是 mark_bar 绘制直方图来解决这个问题。直接使用 transform_bin 可以让您分别获取每个 bin 的开始和结束(在本例中为 xx2)。然后在比例中设置 zero = False 使边界像以前一样适合数据。

layers.append(alt.Chart(data)
.mark_rect()
.transform_bin(as_ = ['x', 'x2'], field = 'x_data')
.encode(x = alt.X('x:Q', scale = {'zero':False}), x2 = 'x2:Q', y = 'count()'))