如何将我的数据集折叠到 Stata 中的中位数和中位数的 95% 置信区间?
How can I collapse my dataset to medians and 95% confidence intervals of the median in Stata?
我希望折叠我的数据集并 (A) 按组获取中位数,并且 (B) 获取这些中位数的 95% 置信区间。
我可以通过使用 collapse (p50) median = cost, by(group)
来实现 (A)。
我可以使用 bysort group: centile cost, c(50)
获得组的置信区间,但我理想情况下希望以类似于 collapse
的方式执行此操作,在其中我可以创建均值、下限的折叠数据集( ll) 和每个组的上限 (ul)(因此我可以导出数据集以在 Excel 中作图)。
数据示例:
input id group cost
1 0 20
2 0 40
3 0 50
4 0 40
5 0 30
6 1 20
7 1 10
8 1 10
9 1 60
10 1 30
end
所需的数据集(或类似的东西):
. list
+-----------------------+
| group p50 ll ul |
|-----------------------|
1. | 0 40 20 50 |
2. | 1 20 10 60 |
+-----------------------+
clear
input id group cost
1 0 20
2 0 40
3 0 50
4 0 40
5 0 30
6 1 20
7 1 10
8 1 10
9 1 60
10 1 30
end
statsby median=r(c_1) ub=r(ub_1) lb=r(lb_1), by(group) clear: centile cost
list
+--------------------------+
| group median ub lb |
|--------------------------|
1. | 0 40 50 20 |
2. | 1 20 60 10 |
+--------------------------+
除了通常的 help
和手动输入之外,this paper 还包含一个关于这个累积估计值和置信区间问题的即兴表演。
我希望折叠我的数据集并 (A) 按组获取中位数,并且 (B) 获取这些中位数的 95% 置信区间。
我可以通过使用 collapse (p50) median = cost, by(group)
来实现 (A)。
我可以使用 bysort group: centile cost, c(50)
获得组的置信区间,但我理想情况下希望以类似于 collapse
的方式执行此操作,在其中我可以创建均值、下限的折叠数据集( ll) 和每个组的上限 (ul)(因此我可以导出数据集以在 Excel 中作图)。
数据示例:
input id group cost
1 0 20
2 0 40
3 0 50
4 0 40
5 0 30
6 1 20
7 1 10
8 1 10
9 1 60
10 1 30
end
所需的数据集(或类似的东西):
. list
+-----------------------+
| group p50 ll ul |
|-----------------------|
1. | 0 40 20 50 |
2. | 1 20 10 60 |
+-----------------------+
clear
input id group cost
1 0 20
2 0 40
3 0 50
4 0 40
5 0 30
6 1 20
7 1 10
8 1 10
9 1 60
10 1 30
end
statsby median=r(c_1) ub=r(ub_1) lb=r(lb_1), by(group) clear: centile cost
list
+--------------------------+
| group median ub lb |
|--------------------------|
1. | 0 40 50 20 |
2. | 1 20 60 10 |
+--------------------------+
除了通常的 help
和手动输入之外,this paper 还包含一个关于这个累积估计值和置信区间问题的即兴表演。