Plotnine - 将垂直线和直方图添加到同一图表
Plotnine - adding vertical lines and histograms to same chart
我正在尝试弄清楚如何在 python 中执行此操作,因为我对 R 比较陌生。
import plotnine as p9
import pandas as pd
import numpy as np
###load the data here...
dataset=pd.read_csv('https://gist.githubusercontent.com/curran/a08a1080b88344b0c8a7/raw/d546eaee765268bf2f487608c537c05e22e4b221/iris.csv')
不工作的例子...不确定我错了什么...
p9.ggplot(dataset, p9.aes(x='sepal_width'))+p9.geom_density()+p9.geom_vline( p9.aes(xintercept='sepal_length.mean()', color='species'))
为什么颜色不起作用?我想要一条具有适当颜色的垂直线
要是能叠加直方图就好了
您必须单独进行数据操作。如果计算在 stat
中完成,Plotnine/ggplot 将计算出正确的均值。对于您的情况,计算是通过映射完成的,即 xintercept='sepal_length.mean()'
将 xintercept
映射到 sepal_length
均值,它不关心 color='species'
,因此 xintercept
是全球平均水平!
from plotnine import *
from plydata import *
df = (
dataset
>> group_by('species')
>> summarise(sl_mean='mean(sepal_length)')
)
(ggplot(dataset, aes(x='sepal_width'))
+ geom_density()
+ geom_vline(df, aes(xintercept='sl_mean', color='species'))
)
添加直方图
(ggplot(dataset, aes(x='sepal_width'))
+ geom_histogram(aes(y='stat(density)'), alpha=.2)
+ geom_density()
+ geom_vline(df, aes(xintercept='sl_mean', color='species'))
)
我正在尝试弄清楚如何在 python 中执行此操作,因为我对 R 比较陌生。
import plotnine as p9
import pandas as pd
import numpy as np
###load the data here...
dataset=pd.read_csv('https://gist.githubusercontent.com/curran/a08a1080b88344b0c8a7/raw/d546eaee765268bf2f487608c537c05e22e4b221/iris.csv')
不工作的例子...不确定我错了什么...
p9.ggplot(dataset, p9.aes(x='sepal_width'))+p9.geom_density()+p9.geom_vline( p9.aes(xintercept='sepal_length.mean()', color='species'))
为什么颜色不起作用?我想要一条具有适当颜色的垂直线
要是能叠加直方图就好了
您必须单独进行数据操作。如果计算在 stat
中完成,Plotnine/ggplot 将计算出正确的均值。对于您的情况,计算是通过映射完成的,即 xintercept='sepal_length.mean()'
将 xintercept
映射到 sepal_length
均值,它不关心 color='species'
,因此 xintercept
是全球平均水平!
from plotnine import *
from plydata import *
df = (
dataset
>> group_by('species')
>> summarise(sl_mean='mean(sepal_length)')
)
(ggplot(dataset, aes(x='sepal_width'))
+ geom_density()
+ geom_vline(df, aes(xintercept='sl_mean', color='species'))
)
添加直方图
(ggplot(dataset, aes(x='sepal_width'))
+ geom_histogram(aes(y='stat(density)'), alpha=.2)
+ geom_density()
+ geom_vline(df, aes(xintercept='sl_mean', color='species'))
)