Stata:多个日期范围内的重叠天数

Stata: Number of overlapping days within multiple date ranges

我想计算多个日期范围内的重叠天数。例如,在下面的示例数据中,有 167 天重叠:第一天从 07jan 到 04apr,第二个从 30may 到 15aug.

start          end        
01jan2000    04apr2000 
30may2000    15aug2000
07jan2000    31dec2000

这相当粗糙,但可以完成工作。本质上,你

  1. 将数据重塑为长格式,这在 Stata 中处理面板数据时通常是个好主意
  2. 填补每个咒语开始和结束之间的空白
  3. 保留多次出现的日期
  4. 计算日期的不同值

清除

/* Fake Data */
input str9(start  end)      
"01jan2000" "04apr2000"
"30may2000" "15aug2000"
"07jan2000" "31dec2000"
end

foreach var of varlist start end {
    gen d = date(`var', "DMY")
    drop `var'
    gen `var' = d
    format %td `var'
    drop d
}

/* Count Overlapping Days */
rename (start end) date=
gen spell = _n
reshape long date, i(spell) j(range) string
drop range
xtset spell date, delta(1 day)
tsfill
bys date: keep if _N>1
distinct date