tibble 数据帧中原子向量的访问频率

Access frequencies of an atomic vector in a tibble data frame

我正在对 tibble 数据框进行探索性数据分析。我从来没有使用过 tibble,所以我遇到了一些困难。 我的 tibble 数据框有这样的结构:

spec_tbl_df [7,397 x 19] (S3: spec_tbl_df/tbl_df/tbl/data.frame)
 $ X1                     : num [1:7397] 9617 12179 9905 5745 10067 ...
 $ Administrative         : num [1:7397] 5 26 4 3 7 16 4 3 2 0 ...
 $ Administrative_Duration: num [1:7397] 408 1562 58 103 165 ...
 $ Informational          : num [1:7397] 2 9 2 0 1 3 4 5 0 0 ...
 $ Informational_Duration : num [1:7397] 47.5 503.7 28.5 0 28.5 ...
 $ ProductRelated         : num [1:7397] 54 183 82 25 115 86 75 23 27 33 ...
 $ ProductRelated_Duration: num [1:7397] 1547 9676 4729 1109 3428 ...
 $ BounceRates            : num [1:7397] 0 0.0111 0 0 0 ...
 $ ExitRates              : num [1:7397] 0.01733 0.0142 0.01454 0.00167 0.01629 ...
 $ PageValues             : num [1:7397] 0 19.57 9.06 61.3 4.97 ...
 $ SpecialDay             : num [1:7397] 0 0 0 0 0 0 0 0 0 0 ...
 $ Month                  : Factor w/ 10 levels "Aug","Dec","Feb",..: 8 8 8 1 8 4 8 7 8 8 ...
 $ OperatingSystems       : Factor w/ 8 levels "1","2","3","4",..: 2 3 2 2 2 3 3 4 8 2 ...
 $ Browser                : Factor w/ 13 levels "1","2","3","4",..: 2 2 2 2 2 2 2 1 2 5 ...
 $ Region                 : Factor w/ 9 levels "1","2","3","4",..: 3 2 1 6 4 8 1 1 7 3 ...
 $ TrafficType            : Factor w/ 19 levels "1","2","3","4",..: 2 12 2 5 10 4 2 4 2 1 ...
 $ VisitorType            : Factor w/ 3 levels "New_Visitor",..: 3 3 3 1 3 3 3 3 1 3 ...
 $ Weekend                : Factor w/ 2 levels "FALSE","TRUE": 2 1 1 1 1 1 1 1 1 1 ...
 $ Revenue                : Factor w/ 2 levels "FALSE","TRUE": 2 2 2 2 2 2 2 2 2 2 ...

现在,如果我使用 plot_bar 绘制天主教数据(使用 DataExplorer 包),我没有问题。例如,我想为分类变量“月”创建一个箱线图,其中每个月我都有一个箱线图显示值是如何分配的。问题是我找不到访问频率的方法。如果我执行以下操作:

boxplot(Month)

它为所有数据(所有月份)创建了一个箱线图,但它根本没有帮助。像这样:

我想要 x 轴上的月份和 y 轴上的频率以及每个月的箱线图。 我试图“提取”特征月,将其转换为矩阵并重复该过程,但它不起作用。 这是单独使用的变量 montht:

> summary(x_Month)
 Aug  Dec  Feb  Jul June  Mar  May  Nov  Oct  Sep 
 258 1034  123  259  166 1125 2014 1814  327  277 

我错过了什么?

像这样的东西可能会为 Month:

的频率创建条形图
library(ggplot2)

spec_tbl_df %>%
    ggplot(aes(x = Month)) +
        geom_bar()