如何:按百分比分隔连续变量?

how to: Separate a continuous variable by % proportions?

我有一个连续变量(在本例中,是花费的费用)。我如何确定 % 支出截止点?即我如何知道将底部 50% 与顶部 50% 分开的美元数额(对于我可能感兴趣的任何其他 % 也是如此)。非常感谢您的帮助

首先,充分利用 Stata 的帮助文件:例如search percentiles returns 可能的命令列表。两个可能有用的命令是 summarize(带有 detail 选项;请注意,您可以在之后使用 return list 得到 view/store 结果 [无论 detail 选项已指定]) 和 pctile.

有关详细信息,请参阅 http://www.stata.com/help.cgi?summarize and http://www.stata.com/help.cgi?pctile

例如:

. sysuse auto
(1978 Automobile Data)

. summarize price, detail

                            Price
-------------------------------------------------------------
      Percentiles      Smallest
 1%         3291           3291
 5%         3748           3299
10%         3895           3667       Obs                  74
25%         4195           3748       Sum of Wgt.          74

50%       5006.5                      Mean           6165.257
                        Largest       Std. Dev.      2949.496
75%         6342          13466
90%        11385          13594       Variance        8699526
95%        13466          14500       Skewness       1.653434
99%        15906          15906       Kurtosis       4.819188

. di r(p50)
5006.5