对堆积条形图进行排序
Sorting a stacked bar chart
我可以通过执行以下操作创建堆积条形图:
import pandas as pd
import numpy as np
import altair as alt
data = {'First': {('Header-1', 'H1-A'): 'Red',
('Header-1', 'H1-B'): 'Red',
('Header-1', 'H1-C'): 'Red',
('Header-2', 'H2-A'): 'White',
('Header-2', 'H2-B'): 'White',
('Header-2', 'H2-C'): 'Yellow',
('Header-3', 'H3-A'): 'Red',
('Header-3', 'H3-B'): 'White',
('Header-3', 'H3-C'): 'White',
('Header-3', 'H3-D'): 'Yellow'},
'Second': {('Header-1', 'H1-A'): 'White',
('Header-1', 'H1-B'): 'Yellow',
('Header-1', 'H1-C'): 'Yellow',
('Header-2', 'H2-A'): 'Yellow',
('Header-2', 'H2-B'): 'Green',
('Header-2', 'H2-C'): 'Green',
('Header-3', 'H3-A'): 'Green',
('Header-3', 'H3-B'): 'Red',
('Header-3', 'H3-C'): 'Red',
('Header-3', 'H3-D'): 'White'},
'Third': {('Header-1', 'H1-A'): 'Red',
('Header-1', 'H1-B'): 'Green',
('Header-1', 'H1-C'): 'Green',
('Header-2', 'H2-A'): 'Green',
('Header-2', 'H2-B'): 'White',
('Header-2', 'H2-C'): 'White',
('Header-3', 'H3-A'): 'White',
('Header-3', 'H3-B'): 'Green',
('Header-3', 'H3-C'): 'Green',
('Header-3', 'H3-D'): 'Yellow'},
}
df = pd.DataFrame(data)
column_counts = df.apply(pd.Series.value_counts).fillna(0)
column_counts[column_counts.columns] = column_counts[column_counts.columns].astype('int64')
unstacked = pd.DataFrame(column_counts.unstack())
unstacked = unstacked.reset_index()
unstacked.columns = ['category','kind','counts']
alt.Chart( unstacked ).mark_bar().encode(
x='category',
y='sum(counts)',
color='kind'
)
我确实可以通过以下方式控制堆栈的顺序:
alt.Chart( unstacked ).mark_bar().encode(
x='category',
y='sum(counts)',
color='kind',
order=alt.Order(
'kind',
sort='descending'
)
)
但是alt.Order的排序参数只接受'ascending'或'descending'。我想自定义顺序为绿、黄、红、白
这可能吗?怎么样?
除了基于另一个字段的降序或升序之外,无法直接提供自定义堆栈顺序。但是您可以通过提供包含您想要的顺序的字段来自定义它。
这可以通过 calculate transform in the chart spec (the vega-lite version of this approach for stack order is outlined here) 或通过预处理 Pandas 中的数据来完成。
这是预处理方法的示例:
unstacked['order'] = unstacked['kind'].replace(
{val: i for i, val in enumerate(['Green', 'Yellow', 'Red', 'White'])}
)
alt.Chart( unstacked ).mark_bar().encode(
x='category',
y='sum(counts)',
color=alt.Color('kind',
# optional: make color order in legend match stack order
sort=alt.EncodingSortField('order', order='descending')
),
order='order', # this controls stack order
)
我可以通过执行以下操作创建堆积条形图:
import pandas as pd
import numpy as np
import altair as alt
data = {'First': {('Header-1', 'H1-A'): 'Red',
('Header-1', 'H1-B'): 'Red',
('Header-1', 'H1-C'): 'Red',
('Header-2', 'H2-A'): 'White',
('Header-2', 'H2-B'): 'White',
('Header-2', 'H2-C'): 'Yellow',
('Header-3', 'H3-A'): 'Red',
('Header-3', 'H3-B'): 'White',
('Header-3', 'H3-C'): 'White',
('Header-3', 'H3-D'): 'Yellow'},
'Second': {('Header-1', 'H1-A'): 'White',
('Header-1', 'H1-B'): 'Yellow',
('Header-1', 'H1-C'): 'Yellow',
('Header-2', 'H2-A'): 'Yellow',
('Header-2', 'H2-B'): 'Green',
('Header-2', 'H2-C'): 'Green',
('Header-3', 'H3-A'): 'Green',
('Header-3', 'H3-B'): 'Red',
('Header-3', 'H3-C'): 'Red',
('Header-3', 'H3-D'): 'White'},
'Third': {('Header-1', 'H1-A'): 'Red',
('Header-1', 'H1-B'): 'Green',
('Header-1', 'H1-C'): 'Green',
('Header-2', 'H2-A'): 'Green',
('Header-2', 'H2-B'): 'White',
('Header-2', 'H2-C'): 'White',
('Header-3', 'H3-A'): 'White',
('Header-3', 'H3-B'): 'Green',
('Header-3', 'H3-C'): 'Green',
('Header-3', 'H3-D'): 'Yellow'},
}
df = pd.DataFrame(data)
column_counts = df.apply(pd.Series.value_counts).fillna(0)
column_counts[column_counts.columns] = column_counts[column_counts.columns].astype('int64')
unstacked = pd.DataFrame(column_counts.unstack())
unstacked = unstacked.reset_index()
unstacked.columns = ['category','kind','counts']
alt.Chart( unstacked ).mark_bar().encode(
x='category',
y='sum(counts)',
color='kind'
)
我确实可以通过以下方式控制堆栈的顺序:
alt.Chart( unstacked ).mark_bar().encode(
x='category',
y='sum(counts)',
color='kind',
order=alt.Order(
'kind',
sort='descending'
)
)
但是alt.Order的排序参数只接受'ascending'或'descending'。我想自定义顺序为绿、黄、红、白
这可能吗?怎么样?
除了基于另一个字段的降序或升序之外,无法直接提供自定义堆栈顺序。但是您可以通过提供包含您想要的顺序的字段来自定义它。
这可以通过 calculate transform in the chart spec (the vega-lite version of this approach for stack order is outlined here) 或通过预处理 Pandas 中的数据来完成。
这是预处理方法的示例:
unstacked['order'] = unstacked['kind'].replace(
{val: i for i, val in enumerate(['Green', 'Yellow', 'Red', 'White'])}
)
alt.Chart( unstacked ).mark_bar().encode(
x='category',
y='sum(counts)',
color=alt.Color('kind',
# optional: make color order in legend match stack order
sort=alt.EncodingSortField('order', order='descending')
),
order='order', # this controls stack order
)