如何:按百分比分隔连续变量?
how to: Separate a continuous variable by % proportions?
我有一个连续变量(在本例中,是花费的费用)。我如何确定 % 支出截止点?即我如何知道将底部 50% 与顶部 50% 分开的美元数额(对于我可能感兴趣的任何其他 % 也是如此)。非常感谢您的帮助
首先,充分利用 Stata 的帮助文件:例如、search percentiles
returns 可能的命令列表。两个可能有用的命令是 summarize
(带有 detail
选项;请注意,您可以在之后使用 return list
得到 view/store 结果 [无论 detail
选项已指定]) 和 pctile
.
有关详细信息,请参阅 http://www.stata.com/help.cgi?summarize and http://www.stata.com/help.cgi?pctile。
例如:
. sysuse auto
(1978 Automobile Data)
. summarize price, detail
Price
-------------------------------------------------------------
Percentiles Smallest
1% 3291 3291
5% 3748 3299
10% 3895 3667 Obs 74
25% 4195 3748 Sum of Wgt. 74
50% 5006.5 Mean 6165.257
Largest Std. Dev. 2949.496
75% 6342 13466
90% 11385 13594 Variance 8699526
95% 13466 14500 Skewness 1.653434
99% 15906 15906 Kurtosis 4.819188
. di r(p50)
5006.5
我有一个连续变量(在本例中,是花费的费用)。我如何确定 % 支出截止点?即我如何知道将底部 50% 与顶部 50% 分开的美元数额(对于我可能感兴趣的任何其他 % 也是如此)。非常感谢您的帮助
首先,充分利用 Stata 的帮助文件:例如、search percentiles
returns 可能的命令列表。两个可能有用的命令是 summarize
(带有 detail
选项;请注意,您可以在之后使用 return list
得到 view/store 结果 [无论 detail
选项已指定]) 和 pctile
.
有关详细信息,请参阅 http://www.stata.com/help.cgi?summarize and http://www.stata.com/help.cgi?pctile。
例如:
. sysuse auto
(1978 Automobile Data)
. summarize price, detail
Price
-------------------------------------------------------------
Percentiles Smallest
1% 3291 3291
5% 3748 3299
10% 3895 3667 Obs 74
25% 4195 3748 Sum of Wgt. 74
50% 5006.5 Mean 6165.257
Largest Std. Dev. 2949.496
75% 6342 13466
90% 11385 13594 Variance 8699526
95% 13466 14500 Skewness 1.653434
99% 15906 15906 Kurtosis 4.819188
. di r(p50)
5006.5