如何在按时间段分组的 streamlit 上绘制图表?

How can I make a plotly graph on streamlit grouped by period?

我正在尝试使用 Plotly + Streamlit 绘制折线图,​​但按月对数据进行分组。

我有这个数据:

id      date          grade
A       2020-01-01    100
B       2020-01-11    200
C       2020-01-21    500
D       2020-01-21    300
E       2020-02-01    100
F       2020-02-01    200

我想按月绘制成绩平均值。这是我到目前为止得到的:

df = pd.to_datetime(df["date"], format="%m/%d/%y %I:%M%p")

df_grouped = df.groupby(
    by=[df.index.month, df.index.year]
)

df.grade.mean().plot()

问题是我不知道如何使用 plotly 和 streamlit 做同样的事情(或类似的事情)。

有什么想法吗?

您没有指定您想要哪种类型的条,但我猜 go.Bar() 就可以了。但我们可以改变它。对于分组和聚合,我将使用以下方法:

df['date'] = pd.to_datetime(df["date"])
df['months'] = df['date'].dt.month_name()
df_months = df.groupby(['months']).agg('mean').reset_index()
new_order = ['January', 'February', 'March', 'April', 'May', 'June', 'July', 'August', 'September', 'October', 'November', 'December']
df_months['months'] = pd.Categorical(df_months['months'], categories=new_order, ordered=True)
df_months = df_months.sort_values('months')

为什么这么复杂?因为我假设您希望在 x 轴上显示月份名称。在按月份名称对值进行分组和聚合之后,月份的顺序可能会变得混乱。上面有点费力的方法确保不会发生这种情况,并且您可以按照正确的顺序得到这个带有月份的条形图:

完整代码:

import pandas as pd
import plotly.graph_objects as go

df = pd.DataFrame({'id': {0: 'A', 1: 'B', 2: 'C', 3: 'D', 4: 'E', 5: 'F'},
                     'date': {0: '2020-01-01',
                      1: '2020-01-11',
                      2: '2020-01-21',
                      3: '2020-01-21',
                      4: '2020-02-01',
                      5: '2020-02-01'},
                     'grade': {0: 100, 1: 200, 2: 500, 3: 300, 4: 100, 5: 200}})

df['date'] = pd.to_datetime(df["date"])
df['months'] = df['date'].dt.month_name()
df_months = df.groupby(['months']).agg('mean').reset_index()
new_order = ['January', 'February', 'March', 'April', 'May', 'June', 'July', 'August', 'September', 'October', 'November', 'December']
df_months['months'] = pd.Categorical(df_months['months'], categories=new_order, ordered=True)
df_months = df_months.sort_values('months')

fig=go.Figure(go.Bar(x=df_months.months, y=df_months.grade))
fig.show()