第 77 章 縱向研究數據 longitudinal data 2
本章沒有代碼,學會如何用矩陣標記法寫下你的多元混合效應模型。
77.1 邊際結構 marginal structures
至此,我們接觸過的各種混合效應模型其實代表的是數據不同的邊際結構關系 (marginal relations)。
77.1.1 隨機截距模型
縱向數據中,數據可能是平衡或不平衡數據,簡單的隨機截距模型可以標記如下:
Yij=(β0+u0j)+β1tij+eij
這個模型隱含着如下的條件關系 (conditional relation):
Yij|tij,u0j∼N(β0+β1tij+u0j,σ2e)u0j|tij∼N(0,σ2u)Var(Yij|tij,u0j)=σ2e
也就是說,觀測值 Yij 以時間 t,和隨機截距 u0 爲條件的方差,只取決於 σ2e。所以,屬於同一層 (同一患者不同測量時間) 的測量值,以該層 (患者) 的截距爲條件 (conditional on uj) 的協方差是 Cov(Yij,Yi∗j|tij,ti∗j,uj)=0。
Yij 針對 uj 的邊際期望 (marginal espectation with respect to uj):
E(Yij|tij)=β0+β1tij
其方差爲 Var(Yij|tij)=σ2u+σ2e,同一層 (同一患者) 的兩個不同時刻測量值之間的邊際協方差就是 Cov(Yij,Yi∗j|tij,ti∗j)=σ2u。
77.1.2 隨機系數模型
模型的數學標記是
Yij=(β0+u0j)+(β1+u1j)tij+eij
等同於
Yij=(β0+β1tij)+(u0j+u1jtij)+eij
其條件關系是
Yij|tij,u0j,u1j∼N(β0+β1tij+u0j+u1jtij,σ2e)
其中, uj|tij∼N(0,Σu),且
∑u=(σ2u00σu01σu01σ2u11)Cov(Yij,Yi∗j|tij,ti∗j,uoj,u1j)=0
其所指的Yij的邊際分布:
E(Yij|tij)=β0+β1tijVar(Yij)=σ2u00+2σu01tij+σ2u11t2ij+σ2eCov(Yij,Yi∗j)=Cov(u0j+u1jtij+eij,u0j+u1jti∗j+ei∗j)=σ2u00+σu01(tij+ti∗j)+σ2u11tijti∗j (for i≠i∗)Cov(Yij,Yi∗j∗)=Cov(u0j+u1jtij+eij,u0j∗+u1j∗ti∗j∗+ei∗j∗)=0 (for j≠j∗)
也就是說同一層 (同一患者) 的不同測量值之間的協方差不爲零,是時間的函數。
77.2 矩陣記法
如果數據本身是平衡數據,可以用如下的矩陣標記混合效應模型,
- j 是每個患者 (第二層級),Yj,ej 向量被定義爲:
Yj=(Y1jY2j⋯⋯Ynj)ej=(e1je2j⋯⋯enj)
用三次測量時間 t1,t2,t3 (以簡便標記) 來繼續接下來的推導,定義矩陣 T,β,uj:
T=(1t11t21t3)β=(β0β1)uj=(u0ju1j)
如此經過利用定義好的向量,我們就可以把模型用矩陣標記來記錄,從無窮無盡的下標中解放出來:
Y=Tβ+Tu+eWhere u∼N(0,Σu)e∼N(0,σ2eI)
那麼
Var(Y)=TΣuTT+σ2eI
77.3 混合效應模型的一般化公式
前面的例子用的雖然是時間做解釋變量 (縱向數據),但是也可以推廣到一般的混合效應模型:
Y=Tβ+Zu+e
其中 Z 是類似 T 的共變量矩陣。類似地,Y 的方差是:
Var(Y)=ZΣuZT+ΣeY∼N(Tβ,ZΣuZT+Σe)
這就是一個多元線性混合效應回歸模型,大多數情況下,Σe=σ2eI。
77.4 其他可選擇的方差協方差矩陣特徵
學會了上面的矩陣標記以後,就應該了解在這樣的多元混合效應模型中,對於層內方差,協方差矩陣的 Σu 結構初步假設是相當重要的。目前爲止我們接觸過的模型的方差協方差矩陣結構列舉如下 (爲了簡便標記都用3×3 的矩陣來表示):
- 復合對稱結構 (compound symmetry structure - compound symmetry model) 又名爲可交換結構 (exchangeable structure)
∑u=(σ2u+σ2eσ2uσ2uσ2uσ2u+σ2eσ2uσ2uσ2uσ2u+σ2e)
- 隨機系數結構 random coefficient (RC) structure
∑u=(σ2u00+σ2eσ2u00+σu01σ2u00+2σu01σ2u00+σu01σ2u00+2σu01+σ2u11+σ2eσ2u00+3σu01+2σ2u11σ2u00+2σu01σ2u00+3σu01+2σ2u11σ2u00+4σu01+4σ2u11+σ2e)
除了這兩個結構以外其他常見方差寫方差結構還有:
- 自回歸結構 (autoregressive structure):
ϕ1−α2(1αα2α1αα2α1)
- 無固定結構 (unstructure):
(σ11σ12σ13σ21σ22σ23σ31σ32σ33)
最後不要忘記了還有完全獨立結構 (不需要任何復雜模型或校正其數據間的依賴性):
σ2(100010001)
77.5 其他要點評論
各種結構模型之間的相互比較
- 似然比檢驗法 the likelihood ratio test (LRT)
前提是模型的固定結構不發生改變,兩個嵌套式模型之間的比較是可以使用死然比檢驗的。缺點是統計學效能可能不太理想 (low power) - 模型的比較指標 information criteria
就算是同一個數據,如果不同的協方差結構矩陣模型的固定效應部分也不同,似然比檢驗也不使用,這時候應該求助於赤池信息量 (Akaike’s Information Criterion, AIC),或者貝葉斯信息量 (Bayesian Criterion, BIC) 的比較。這兩個信息量都是使用的模型的似然減去相應模型的參數數量作爲評判標準。差別是 BIC 對參數的調整更加大些。但是,沒人可以保證這些信息會永遠相互認證,他們可能出現互相矛盾,也沒人可以保證使用這些信息的比較可以證明你的模型是”最佳”模型。
- 似然比檢驗法 the likelihood ratio test (LRT)