在 plotnine 中创建自定义图例

Creating a custom legend in plotnine

我在通过 aes()

自定义图例时遇到了问题

我有以下代码:

import pandas as pd
from plotnine import *

data1 = {'dilution': [2.000000, 2.477121, 2.954243, 3.431364, 3.908485, 4.385606, 4.862728, 5.339849, 5.816970, 2.000000, 2.477121, 2.954243, 3.431364, 3.908485, 4.385606, 4.862728, 5.339849, 5.816970],
'variable': ["mouse 1", "mouse 1", "mouse 1", "mouse 1", "mouse 1", "mouse 1", "mouse 1", "mouse 1", "mouse 1", "mouse 2", "mouse 2", "mouse 2", "mouse 2", "mouse 2", "mouse 2", "mouse 2", "mouse 2", "mouse 2"],
'value': [547.180708, 495.883622, 439.109089, 277.819313, 115.926188, 42.041189, 15.276367, 11.696537, 2.280014, 269.398164, 233.667531, 215.410352, 169.512070, 102.877518, 36.860550, 13.960504, 4.891481, -3.465304]}
df1 = pd.DataFrame.from_dict(data1)
data2 = {'dilution': [2.0, 2.0, 2.0],
'value': [-7.873768, -3.926121, 4.170833] }
df2 = pd.DataFrame.from_dict(data2)

data3 = {'dilution': [3.90309, 3.90309],
'value': [756.715198, 540.613828],
'variable': ["mouse 1", "mouse 2"]}
df3 = pd.DataFrame.from_dict(data3)

g = (ggplot(df1)
+ geom_line(aes(x='dilution', y='value', color='variable'), data=df1, size=1.0)
+ geom_point(aes(x='dilution', y='value', color='variable'), data=df1, size=1.0)
+ geom_point(aes(x='dilution', y='value'), data=df2, size=3.0)
+ geom_point(aes(x='dilution', y='value', color='variable'), data=df3, size=2.0, shape='s')
+ scale_x_continuous( )
)
print(g)

生成下图:

example plotnine with black data points

如您所见,来自 df2 的数据点没有出现在图例中。我想要图例中的一个黑点来代表 df2 中的所有点。如果我按如下方式更改 data2,我可以在图例中显示它:

data2 = {'dilution': [2.0, 2.0, 2.0],
'value': [-7.873768, -3.926121, 4.170833],
'type': ['test', 'test', 'test']}

然后映射到美学如下:geom_point(aes(x='dilution', y='value', color='type'), data=df2, size=3.0)

但是点不再是黑色的,我似乎无法再次将点变回黑色。添加 color='black' 参数不起作用:

example plotting with coloured legend points

是否有更好的解决方案来保持 df2 的所有数据点为黑色,同时只在图例中作为黑点出现一次?

其次,有没有办法在图例中添加一个黑色方块来表示来自 df3 的所有数据点?

图例是自动的。影响它的唯一方法是更改​​ dataaes 映射或 scale 参数。问题是您正在尝试创建具有不同映射的层,但期望它们共享一个图例。

Is there a better solution to keeping all the datapoint of df2 black while only appearing once in the legend as a black point?

解决方案是将数据处理成一个连贯的整体,或者确保不同的数据帧具有相似的列,这些列映射到相同的美学(你似乎已经用第二个 df2 做到了)。那么如果你想控制图例中的颜色,你应该使用手动刻度。

+ scale_color_manual(['red', 'cyan', 'black'])

Secondly, is there a way of adding into the legend a single black square to represent all the datapoints from df3?

没有办法做到这一点。

要点是,图例是理解数据的指南,如果您有操纵其中显示的项目的冲动,那么数据很可能没有正确组织。此外,如果您想标记 "special" 个点,请使用注释。