Plotnine - 将垂直线和直方图添加到同一图表

Plotnine - adding vertical lines and histograms to same chart

我正在尝试弄清楚如何在 python 中执行此操作,因为我对 R 比较陌生。

import plotnine as p9
import pandas as pd
import numpy as np

###load the data here...
dataset=pd.read_csv('https://gist.githubusercontent.com/curran/a08a1080b88344b0c8a7/raw/d546eaee765268bf2f487608c537c05e22e4b221/iris.csv')

不工作的例子...不确定我错了什么...

p9.ggplot(dataset, p9.aes(x='sepal_width'))+p9.geom_density()+p9.geom_vline( p9.aes(xintercept='sepal_length.mean()', color='species'))

为什么颜色不起作用?我想要一条具有适当颜色的垂直线

要是能叠加直方图就好了

您必须单独进行数据操作。如果计算在 stat 中完成,Plotnine/ggplot 将计算出正确的均值。对于您的情况,计算是通过映射完成的,即 xintercept='sepal_length.mean()'xintercept 映射到 sepal_length 均值,它不关心 color='species',因此 xintercept 是全球平均水平!

from plotnine import *
from plydata import *

df = (
    dataset
    >> group_by('species')
    >> summarise(sl_mean='mean(sepal_length)')
)

(ggplot(dataset, aes(x='sepal_width'))
 + geom_density()
 + geom_vline(df, aes(xintercept='sl_mean', color='species'))
)

添加直方图

(ggplot(dataset, aes(x='sepal_width'))
 + geom_histogram(aes(y='stat(density)'), alpha=.2)
 + geom_density()
 + geom_vline(df, aes(xintercept='sl_mean', color='species'))
)