使用 R 中数据框中的 recurring/grouped 行制作分组箱线图
Make a grouped boxplot with the recurring/grouped rows in a dataframe in R
我想制作这样的分组箱线图
包含三列数据框的元素、ID、issuer_bank 和每笔交易的风险评分。
我的起始数据框如下所示:
ID
issuer_name
risk_score
1
POSTEPAY
0
2
BANCA SELLA
10
3
BANCA SELLA
10
4
BANCA SELLA
10
5
BANCA SELLA
33
6
POSTEPAY
0
7
POSTEPAY
0
8
POSTEPAY
10
9
CASSA CENTRALE BANCA - CREDITO
0
10
BANCA NAZIONALE DEL LAVORO SP
0
11
BANCO BPM SOCIETA PER AZIONI
0
12
NEXI PAYMENTS
10
13
UNICREDIT
10
14
CREDITO EMILIANO
0
15
POSTEPAY
0
16
POSTEPAY
10
17
POSTEPAY
0
18
N26 GMBH
10
19
BANCO BPM SOCIETA PER AZIONI
25
20
NEXI PAYMENTS
10
21
POSTEPAY
10
22
INTESA SANPAOLO
0
23
CREDIT AGRICOLE CARIPARMA
10
24
CREDIT AGRICOLE CARIPARMA
10
25
FINECOBANK
0
26
UNICREDIT
44
27
BANCA MONTE DEI PASCHI DI SIENA
0
28
UNICREDIT
0
29
FINECOBANK
25
30
CASSA CENTRALE BANCA - CREDITO
10
31
NEXI PAYMENTS
10
32
INTESA SANPAOLO
25
33
INTESA SANPAOLO
0
34
POSTEPAY
10
35
INTESA SANPAOLO
10
36
INTESA SANPAOLO
20
37
POSTEPAY
10
38
INTESA SANPAOLO
10
39
POSTEPAY
0
40
POSTEPAY
0
41
UNICREDIT
10
42
POSTEPAY
10
43
BIBANCA
0
44
POSTEPAY
0
45
INTESA SANPAOLO
10
46
FINDOMESTIC BANCA
10
47
POSTEPAY
0
48
POSTEPAY
10
我想为 Issuer_name 分组并制作风险评分的箱线图并在一个图表中计算所有内容。
我做的手工流程如下
df_risk_score_single <- df_risk_score %>% filter(issuer_name == "POSTEPAY")
ggplot(data = df_risk_score_single, aes(x= issuer_name, y=risk_score))+geom_boxplot()
其中 return 单个箱线图
有什么建议吗?
我认为您正在寻找类似于以下代码片段的内容,它会生成如下图所示的结果。
我使用了您问题中的示例数据来编辑一个值。当然,您必须根据您的要求并使用您的完整数据来改进此代码。
ggplot(data = df_risk_score, aes(x= issuer_name, y=risk_score, group=issuer_name, fill = issuer_name)) +
geom_boxplot() +
theme(axis.text.x=element_blank(), axis.ticks.x=element_blank()) +
xlab("Issuer") +
ylab("Risk score") +
guides(fill=guide_legend(title="Legend Title: Issuer"))
我想制作这样的分组箱线图
包含三列数据框的元素、ID、issuer_bank 和每笔交易的风险评分。
我的起始数据框如下所示:
ID | issuer_name | risk_score |
---|---|---|
1 | POSTEPAY | 0 |
2 | BANCA SELLA | 10 |
3 | BANCA SELLA | 10 |
4 | BANCA SELLA | 10 |
5 | BANCA SELLA | 33 |
6 | POSTEPAY | 0 |
7 | POSTEPAY | 0 |
8 | POSTEPAY | 10 |
9 | CASSA CENTRALE BANCA - CREDITO | 0 |
10 | BANCA NAZIONALE DEL LAVORO SP | 0 |
11 | BANCO BPM SOCIETA PER AZIONI | 0 |
12 | NEXI PAYMENTS | 10 |
13 | UNICREDIT | 10 |
14 | CREDITO EMILIANO | 0 |
15 | POSTEPAY | 0 |
16 | POSTEPAY | 10 |
17 | POSTEPAY | 0 |
18 | N26 GMBH | 10 |
19 | BANCO BPM SOCIETA PER AZIONI | 25 |
20 | NEXI PAYMENTS | 10 |
21 | POSTEPAY | 10 |
22 | INTESA SANPAOLO | 0 |
23 | CREDIT AGRICOLE CARIPARMA | 10 |
24 | CREDIT AGRICOLE CARIPARMA | 10 |
25 | FINECOBANK | 0 |
26 | UNICREDIT | 44 |
27 | BANCA MONTE DEI PASCHI DI SIENA | 0 |
28 | UNICREDIT | 0 |
29 | FINECOBANK | 25 |
30 | CASSA CENTRALE BANCA - CREDITO | 10 |
31 | NEXI PAYMENTS | 10 |
32 | INTESA SANPAOLO | 25 |
33 | INTESA SANPAOLO | 0 |
34 | POSTEPAY | 10 |
35 | INTESA SANPAOLO | 10 |
36 | INTESA SANPAOLO | 20 |
37 | POSTEPAY | 10 |
38 | INTESA SANPAOLO | 10 |
39 | POSTEPAY | 0 |
40 | POSTEPAY | 0 |
41 | UNICREDIT | 10 |
42 | POSTEPAY | 10 |
43 | BIBANCA | 0 |
44 | POSTEPAY | 0 |
45 | INTESA SANPAOLO | 10 |
46 | FINDOMESTIC BANCA | 10 |
47 | POSTEPAY | 0 |
48 | POSTEPAY | 10 |
我想为 Issuer_name 分组并制作风险评分的箱线图并在一个图表中计算所有内容。
我做的手工流程如下
df_risk_score_single <- df_risk_score %>% filter(issuer_name == "POSTEPAY")
ggplot(data = df_risk_score_single, aes(x= issuer_name, y=risk_score))+geom_boxplot()
其中 return 单个箱线图
有什么建议吗?
我认为您正在寻找类似于以下代码片段的内容,它会生成如下图所示的结果。
我使用了您问题中的示例数据来编辑一个值。当然,您必须根据您的要求并使用您的完整数据来改进此代码。
ggplot(data = df_risk_score, aes(x= issuer_name, y=risk_score, group=issuer_name, fill = issuer_name)) +
geom_boxplot() +
theme(axis.text.x=element_blank(), axis.ticks.x=element_blank()) +
xlab("Issuer") +
ylab("Risk score") +
guides(fill=guide_legend(title="Legend Title: Issuer"))