如何将我的数据集折叠到 Stata 中的中位数和中位数的 95% 置信区间？

Question

我希望折叠我的数据集并 (A) 按组获取中位数，并且 (B) 获取这些中位数的 95% 置信区间。

我可以通过使用 collapse (p50) median = cost, by(group) 来实现 (A)。

我可以使用 bysort group: centile cost, c(50) 获得组的置信区间，但我理想情况下希望以类似于 collapse 的方式执行此操作，在其中我可以创建均值、下限的折叠数据集（ ll) 和每个组的上限 (ul)（因此我可以导出数据集以在 Excel 中作图）。

数据示例：

input id group cost
1 0 20
2 0 40
3 0 50
4 0 40
5 0 30
6 1 20
7 1 10
8 1 10
9 1 60
10 1 30
end

所需的数据集（或类似的东西）：

. list

     +-----------------------+
     | group   p50   ll   ul |
     |-----------------------|
  1. |     0    40   20   50 |
  2. |     1    20   10   60 |
     +-----------------------+

Answer 1

clear 
input id group cost
1 0 20
2 0 40
3 0 50
4 0 40
5 0 30
6 1 20
7 1 10
8 1 10
9 1 60
10 1 30
end

statsby median=r(c_1) ub=r(ub_1) lb=r(lb_1),  by(group) clear: centile cost 

list 

     +--------------------------+
     | group   median   ub   lb |
     |--------------------------|
  1. |     0       40   50   20 |
  2. |     1       20   60   10 |
     +--------------------------+

除了通常的 help 和手动输入之外，this paper 还包含一个关于这个累积估计值和置信区间问题的即兴表演。

如何将我的数据集折叠到 Stata 中的中位数和中位数的 95% 置信区间？

How can I collapse my dataset to medians and 95% confidence intervals of the median in Stata?

stata