第 5 章 二項分佈的概念 Binomial distribution
二項分佈在醫學研究中至關重要,一組二項分佈的數據,指的通常是 \(n\) 次相互獨立的成功率爲 \(\pi\) 的伯努利實驗 (\(n\) independent Bernoulli trials) 中成功的次數。
當 \(X\) 服從二項分佈,記爲 \(X \sim binomial(n, \pi)\) 或\(X \sim bin(n, \pi)\)。它的(第 \(x\) 次實驗的)概率被定義爲:
\[ \begin{align} P(X=x) &= ^nC_x\pi^x(1-\pi)^{n-x} \\ &= \binom{n}{x}\pi^x(1-\pi)^{n-x} \\ & for\;\; x = 0,1,2,\dots,n \end{align} \]
5.1 二項分佈的期望和方差
- 期望 \(E(X)\)
- 若 \(X \sim bin(n,\pi)\),那麼 \(X\) 就是這一系列獨立伯努利實驗中成功的次數。
- 用 \(X_i, i =1,\dots, n\) 標記每個相互獨立的伯努利實驗。
- 那麼我們可以知道 \(X=\sum_{i=1}^nX_i\)。
\[ \begin{align} E(X) &= E(\sum_{i=1}^nX_i)\\ &= E(X_1+X_2+\cdots+X_n) \\ &= E(X_1)+E(X_2)+\cdots+E(X_n)\\ &= \sum_{i=1}^nE(X_i)\\ &= \sum_{i=1}^n\pi \\ &= n\pi \end{align} \]
- 方差 \(Var(X)\)
\[ \begin{align} Var(X) &= Var(\sum_{i=1}^nX_i) \\ &= Var(X_i+X_2+\cdots+X_n) \\ &= Var(X_i)+Var(X_2)+\cdots+Var(X_n) \\ &= \sum_{i=1}^nVar(X_i) \\ &= n\pi(1-\pi) \\ \end{align} \]
5.2 超幾何分佈 hypergeometric distribution
假設我們從總人數爲 \(N\) 的人羣中,採集一個樣本 \(n\)。假如已知在總體人羣中(\(N\))有 \(M\) 人患有某種疾病。請問採集的樣本 \(X=n\) 中患有這種疾病的人,服從怎樣的分佈?
- 從人羣(\(N\))中取出樣本(\(n\)),有 \(^NC_n\) 種方法。
- 從患病人羣(\(M\))中取出患有該病的人(\(x\))有 \(^MC_x\) 種方法。
- 樣本中不患病的人(\(n-x\))被採樣的方法有 \(^{N-M}C_{n-x}\) 種。
- 採集一次 \(n\) 人作爲樣本的概率都一樣。因此:
\[P(X=x)=\frac{\binom{M}{x}\binom{N-M}{n-x}}{\binom{N}{n}}\]
5.3 樂透中獎概率問題:
- 從數字 \(1\sim59\) 中選取 \(6\) 個任意號碼
- 開獎時從 \(59\) 個號碼球中隨機抽取 \(6\) 個
- 如果六個號碼全部猜中(不分順序),你可以成爲百萬富翁。請問一次猜中全部 \(6\) 個號碼的概率是多少?
從 \(59\) 個號碼中隨機取出任意 \(6\) 個號碼的方法有 \(^{59}C_6\) 種。 \[^{59}C_6=\frac{59!}{6!(59-6)!}=45,057,474\]
每次選取六個號碼做爲一組的可能性相同,所以,你買了一組樂透號碼,能中獎的概率就是 \(1/45,057,474 = 0.00000002219\)。你還會再去買彩票麼?