Rambachan and Roth (2020) Design-based uncertainty for quasi-experiments, arXiv.
Section 2: A finite population model for quasi-experiments
- サイズ の有限母集団を考える*1.
- Binary treatment: , potential outcomes: . Potential outcome は固定値と仮定する.
- Observed outcome: .
- 各 が独立にトリートメントを受ける確率を とする. は未知で,potential outcome と相関しても良い: , where は pre-treatment covariates.
- Treatment group と control group のサイズをそれぞれ と とする.
- とすれば,
s.t. (zero otherwise)
- また, と定義する.
Section 3: Simple difference-in-means
- Simple difference-in-means (SDIM) estimator:
- このとき, と定義すれば,
\begin{align} \mathbb{E} \left[ \hat t \mid \sum_{i = 1}^N D_i = N_1 \right] & = \frac{1}{N_1} \sum_{i = 1}^N \pi_i (Y_i(0) + t_i) - \frac{1}{N_0} \sum_{i = 1}^N (1 - \pi_i) Y_i(0) \\& = \frac{1}{N_1} \sum_{i = 1}^N \pi_i t_i + \frac{N}{N_0 N_1} \sum_{i = 1}^N \pi_i Y_i(0) - \frac{1}{N_0} \sum_{i = 1}^N Y_i(0) \end{align}
ここで,
= expected SATT (sample average treatment effect on the treated)
\begin{align} \frac{N}{N_0 N_1} \sum_{i = 1}^N \pi_i Y_i(0) - \frac{1}{N_0} \sum_{i = 1}^N Y_i(0) & = \frac{N}{N_0 N_1} \sum_{i = 1}^N \pi_i Y_i(0) - \frac{N}{N_0 N_1} \sum_{i = 1}^N \frac{N_1}{N} Y_i(0) \\ & = \frac{N N}{N_0 N_1} \left( \frac{1}{N}\sum_{i = 1}^N \left[ \pi_i Y_i(0) - \frac{N_1}{N} Y_i(0) \right] \right) \\ & = \frac{N N}{N_0 N_1} [\text{$\pi_i$ と $Y_i(0)$ の共分散}] \end{align}
- したがって, で, は全ての個人が等しい確率でトリートメントを受けるときには( for all )ゼロになる.
- 以降は variance bound や の漸近正規性について.
Section 4: Difference-in-differences
省略
Section 5: Instrumental variables
- を操作変数として,potential treatment を と書く.観測できる outcome は .
- を満たすグループと を満たすグループのサイズをそれぞれ と とする.
- とすれば,
s.t.
- 単調性を仮定: for all .
- 2SLS with
\begin{align}\hat t_{RF} & \equiv \frac{1}{N^Z_1} \sum_{i=1}^N Z_i Y_i - \frac{1}{N^Z_0} \sum_{i=1}^N (1 - Z_i) Y_i \\\hat t_{FS} & \equiv \frac{1}{N^Z_1} \sum_{i=1}^N Z_i D_i - \frac{1}{N^Z_0} \sum_{i=1}^N (1 - Z_i) D_i \\\end{align}
- ここで, は の SDIM なので,上と同じ計算から
\begin{align} \mathbb{E} \left[ \hat t_{RF} \mid \sum_{i = 1}^N Z_i = N_1^Z \right] & = \frac{1}{N_1^Z} \sum_{i = 1}^N \pi_i^Z (Y_i(D_i(1)) - Y_i(D_i(0))) \\ & \quad + \frac{N N}{N_0^Z N_1^Z} \underbrace{[\text{$\pi_i^Z$ と $Y_i(D_i(0))$ の共分散}]}_{= \: N^{-1} \sum_i (\pi_i^Z - N_1^Z/N)Y_i(D_i(0))} \end{align}
- さらに,Complier の集合を と定義すれば,単調性の仮定から,
- 同様に,
\begin{align} \mathbb{E} \left[ \hat t_{FS} \mid \sum_{i = 1}^N Z_i = N_1^Z \right] & = \frac{1}{N_1^Z} \sum_{i \in \mathcal{C}}^N \pi_i^Z + \frac{N N}{N_0^Z N_1^Z} \underbrace{[\text{$\pi_i^Z$ と $D_i(0)$ の共分散}] }_{= \: N^{-1} \sum_i (\pi_i^Z - N_1^Z/N) D_i(0)}\end{align}
- したがって, for all ならば以下が成り立つ:
”-weighted” LATE.
- 以降は の漸近正規性について.
*1:州や県レベルのデータなどを想定.