第 2 章 Bayes 貝葉斯理論的概念

許多時候,我們需要將概率中的條件相互對調。 例如: 在已知該人羣中有20%的人有吸菸習慣(\(P(S)\)),吸菸的人有9%的概率有哮喘(\(P(A|S)\)),不吸菸的人有7%的概率有哮喘(\(P(A|\bar{S})\))的前提下,有個人前來門診,發現是哮喘患者,那麼這個人有多大的概率是一個菸民?也就是要求 \(P(S|A)\)

這裏先引入貝葉斯的概念:

我們可以將 \(P(A\cap S)\) 寫成: \[P(A\cap S)=P(A|S)P(S)\\or\\ P(A\cap S)=P(S|A)P(A)\] 這兩個等式是完全等價的。我們將他們連起來:

\[P(S|A)P(A)=P(A|S)P(S)\\ \Rightarrow P(S|A)=\frac{P(A|S)P(S)}{P(A)}\]

是不是看起來又像是寫了一堆廢話? 沒錯,你看出來是一堆廢話的時候,證明你也同意這背後的簡單邏輯。

再繼續,我們可以利用另外一個廢話

\[ \because S+\bar{S}=1\\ \therefore P(A)=P(A\cap S)+P(A\cap\bar{S}) \]

用上面的公式替換掉

\[ P(A\cap S)+P(A\cap\bar{S}) \\ \therefore P(A)=P(A|S)P(S)+P(A|\bar{S})P(\bar{S}) \]

可以得到貝葉斯理論公式

\[P(S|A)=\frac{P(A|S)P(S)}{P(A|S)P(S)+P(A|\bar{S})P(\bar{S})}\]

回到上面說到的哮喘人中有多少比例吸菸的問題。可以繼續使用概率樹來方便的計算:

\[\begin{align} P(S|A) &= \frac{P(A|S)P(S)}{P(A|S)P(S)+P(A|\bar{S})P(\bar{S})} \\ &= \frac{0.09\times0.2}{0.09\times0.2+0.07\times0.8} \\ &= 0.24 \end{align}\]

所以我們的結論就是,在已知該人羣中有20%的人有吸菸習慣(\(P(S)\)),吸菸的人有9%的概率有哮喘(\(P(A|S)\)),不吸菸的人有7%的概率有哮喘(\(P(A|\bar{S})\))的前提下,有個人前來門診,發現是哮喘患者,那麼這個人有24% 的概率是一個菸民(\(P(S|A)\))。