Imai, Jiang & Malani (2020) Causal inference with interference and noncompliance in two-stage randomized experiments, JASA.

Two-stage randomized experiments
  •  N units with  J clusters.  n_j = 各クラスターのサイズ ( N = \sum_{j=1}^J n_j).
  • First-stage: クラスターを2つのグループにランダムに分ける.一方のグループはトリートメントの割合が高く,もう一方のグループはコントロールの割合が高い.グループ  j のタイプ =  A_j \in \{0, 1\}.  A_j = 1 ( A_j = 0)  \Rightarrow high (low) proportion of treatment units.
  •  J_1 = \sum_{j = 1}^J A_j,  J_0 = J - J_1. さらに  \mathbf{A} = (A_1, \ldots, A_J) とおく.
  • Second-stage:クラスター内で個人にトリートメントを一旦割り振る.Binary treatment for  i in cluster  j =  Z_{ij}.  \mathbf{Z}_j = (Z_{1j}, \ldots , Z_{n_j j}).
  •  n_{j1} = \sum_{i = 1}^{n_j} Z_{ij},  n_{j0} = n_j - n_{j1}.

Assumption (Two-stage randomization)

1.  \displaystyle \Pr(\mathbf{A} = \mathbf{a}) = \frac{1}{\binom{J}{J_1}} for all  \mathbf{a} suth that  \sum_{j =1}^J a_j = J_1.

2.  \displaystyle \Pr(\mathbf{Z}_j = \mathbf{z} \mid A_j = a) = \frac{1}{\binom{n_j}{n_{ja}}} for all  \mathbf{z} suth that  \sum_{i=1}^{n_j} z_j = n_{ja} *1.

  • この論文でも,有限母集団+固定potential outcome+ランダムネスはトリートメントのみ,という設定を採用.
  • トリートメントのnon-complianceを明示的に考慮する
  • 実際のトリートメントを  D_{ij},観測されるoutcomeを  Y_{ij} とする. \mathbf{D}_j = (D_{1j}, \ldots, D_{n_j j}),  \mathbf{Y}_j = (Y_{1j}, \ldots, Y_{n_j j}).
  • Potential treatment:  D_{ij}(\mathbf{z}), potential outcome:  Y_{ij}(\mathbf{z}; \mathbf{d}). Potential outcome when  \mathbf{Z}_j = \mathbf{z}:  Y_{ij}(\mathbf{z}) = Y_{ij}(\mathbf{z}; D_{ij}(\mathbf{z})).

Assumption (Partial interference)

 Y_{ij}(\mathbf{z}) = Y_{ij}(\mathbf{z}') and  D_{ij}(\mathbf{z}) = D_{ij}(\mathbf{z}')

for all  \mathbf{z},  \mathbf{z}' with  \mathbf{z}_j = \mathbf{z}_j'.

解釈:他クラスターの影響は受けない.

Intention-to-Treat分析*2
  • 以下を定義する:

 \bar D_{ij}(z, a) = \sum_{\mathbf{z}_{-ij}} D_{ij}(Z_{ij} = z, \mathbf{Z}_{-ij} = \mathbf{z}_{-ij}) \Pr(\mathbf{Z}_{-ij} = \mathbf{z}_{-ij} \mid Z_{ij} = z, A_j = a)

 \bar Y_{ij}(z, a) = \sum_{\mathbf{z}_{-ij}} Y_{ij}(Z_{ij} = z, \mathbf{Z}_{-ij} = \mathbf{z}_{-ij}) \Pr(\mathbf{Z}_{-ij} = \mathbf{z}_{-ij} \mid Z_{ij} = z, A_j = a)

  • Average unit-level direct effect

 DED_{ij}(a) = \bar D_{ij}(1, a) - \bar D_{ij}(0, a)

 DEY_{ij}(a) = \bar Y_{ij}(1, a) - \bar Y_{ij}(0, a)

  • さらに,

 DED_j(a) = n_j^{-1} \sum_{i = 1}^{n_j} DED_{ij}(a) ,  DED(a) = N^{-1} \sum_{j = 1}^J n_j DED_j(a)

 DEY_j(a) = n_j^{-1} \sum_{i = 1}^{n_j} DEY_{ij}(a) ,  DEY(a) = N^{-1} \sum_{j = 1}^J n_j DEY_j(a)

  • Average unit-level spillover effect

 SED_{ij}(z) = \bar D_{ij}(z, 1) - \bar D_{ij}(z, 0)

 SEY_{ij}(z) = \bar Y_{ij}(z, 1) - \bar Y_{ij}(z, 0)

  • さらに,

 SED_j(z) = n_j^{-1} \sum_{i = 1}^{n_j} SED_{ij}(z) ,  SED(z) = N^{-1} \sum_{j = 1}^J n_j SED_j(z)

 SEY_j(z) = n_j^{-1} \sum_{i = 1}^{n_j} SEY_{ij}(z) ,  SEY(z) = N^{-1} \sum_{j = 1}^J n_j SEY_j(z)

  • Estimator

 \displaystyle \hat D_j(z, a) = \frac{\sum_{i = 1}^{n_j}D_{ij}\mathbf{1}\{Z_{ij} = z\}}{\sum_{i = 1}^{n_j}\mathbf{1}\{Z_{ij} = z\}}

 \displaystyle \hat D(z, a) = \frac{N^{-1}\sum_{j = 1}^J n_j \hat D_j(z, a) \mathbf{1}\{A_j = a\}}{J^{-1}\sum_{j = 1}^J \mathbf{1}\{A_j = a\}}

  •  Y についても同様に定義する.さらに,

 \widehat{DED}(a) = \hat D(1, a) - \hat D(0, a),  \widehat{SED}(z) = \hat D(z, 1) - \hat D(z, 0)

 \widehat{DEY}(a) = \hat Y(1, a) - \hat Y(0, a),  \widehat{SEY}(z) = \hat Y(z, 1) - \hat Y(z, 0)

  • Assumptions (Two-stage randomization) + (Partial interference)  \Rightarrow これらはunbiased estimator (Theorem 1).
Complier Average Direct Effect
  • 一般的にcomplianceの状況は他者のトリートメントに依存する:

 C_{ij}(\mathbf{z}_{-ij}) = \mathbf{1}\{D_{ij}(1, \mathbf{z}_{-ij}) = 1, D_{ij}(0, \mathbf{z}_{-ij}) = 0\}

 \bar C_{ij}= \sum_{\mathbf{z}_{-ij}} C_{ij}(\mathbf{z}_{-ij}) \Pr(\mathbf{Z}_{-ij} = \mathbf{z}_{-ij} \mid A_j = a) *3

  • Average unit-level complier direct effect

 CDY_{ij}(a) = \sum_{\mathbf{z}_{-ij}} \{Y_{ij}(1, \mathbf{z}_{-ij}) - Y_{ij}(0, \mathbf{z}_{-ij})\} C_{ij}(\mathbf{z}_{-ij}) \Pr(\mathbf{Z}_{-ij} = \mathbf{z}_{-ij} \mid A_j = a)

  • さらに,

 \displaystyle CADE(a) = \frac{\sum_{j = 1}^J \sum_{i = 1}^{n_j} CDY_{ij}(a) }{\sum_{j = 1}^J \sum_{i = 1}^{n_j} \bar C_{ij}}

Assumption (Exclusion restriction)

 Y_{ij}(\mathbf{z}_j; \mathbf{d}_j) = Y_{ij}(\mathbf{z}_j', \mathbf{d}_j) for any  \mathbf{z}_j, \mathbf{z}_j', \mathbf{d}_j

(実際に受けるトリートメントのみに結果は依存)

Assumption (Monotonicity)

 D_{ij}(1, \mathbf{z}_{-ij}) \ge D_{ij}(0, \mathbf{z}_{-ij}) for all  \mathbf{z}_{-ij}

Assumption (Restricted interference)

If  D_{ij}(1, \mathbf{z}_{-ij}) = D_{ij}(0, \mathbf{z}_{-ij}), then  Y_{ij}(\mathbf{D}_j(1, \mathbf{z}_{-ij})) = Y_{ij}(\mathbf{D}_j(0, \mathbf{z}_{-ij}))*4

  • 以上の仮定の下で次の結果を得る:

Theorem 2: Assumptions (Two-stage randomization) -- (Restricted interference)

 \Longrightarrow  \displaystyle \text{plim}_{n_j, J \to \infty}\frac{\widehat{DEY}(a)}{\widehat{DED}(a)} = \text{lim}_{n_j, J \to \infty} CADE(a).

  • 論文の以降では,stratified interference*5をさらに仮定して分析を進める.

*1:論文の  n_{j1} はタイポ?

*2:治療そのもの ( D) ではなく,治療方針 ( Z) の効果を見る分析.

*3:論文では  \bar C_{ij}(\mathbf{z}_{-ij}) となっているが  \mathbf{z}_{-ij} はmarginalizeされているのでは. \bar C_{ij}(a) のタイポ?

*4:この仮定の解釈や具体例については論文参照.

*5: D_{ij}(\mathbf{z}_j) = D_{ij}(\mathbf{z}_j') and  Y_{ij}(\mathbf{z}_j) = Y_{ij}(\mathbf{z}_j') if  z_{ij} = z_{ij}' and  \sum_{i=1}^{n_j} z_{ij} = \sum_{i=1}^{n_j} z_{ij}'