Skip to main content

贝叶斯定理

· 7 min read
PuQing
AI, CVer, Pythoner, Half-stack Developer

条件概率

条件概率一般记作 P(AB)P(A\mid B),意思是当 BB 事件发生时,AA 事件发生的概率,其定义为

P(AB)=P(AB)P(B)P(A\mid B)=\frac{P(A\cap B)}{P(B)}

其中 P(AB)P(A\cap B) 意思是 AABB 共同发生的概率,称为联合概率。也可以写作 P(A,B)P(A,B)P(AB)P(AB)

如何对他有更深刻的认识呢?

tip

当我们说 AA 发生的概率 P(A)P(A),实际上就是说在 样本空间 中,事件 AA 发生的数量占 Ω\boldsymbol{\Omega} 的比率。

info

条件意味着缩小了样本空间,是二级概率

条件概率中的 P(AB)P(A\mid B) 意思是事件 BB 发生的情况下,事件 AA 发生的概率,所以此时 P(AB)P(A\mid B) 已经不是针对于样本空间 Ω\boldsymbol{\Omega} 而是缩小的样本空间 BB

Untitled(1).bmp

结合上图来讲就是,条件概率 P(AB)P(A\mid B) 就是

P(AB)=size(AB)size(B)P(A\mid B) = \frac{\text{size}(A\cap B)}{\text{size}(B)}

考虑到 P(AB)=size(AB)size(Ω)P(A\cap B)=\displaystyle \frac{\text{size}(A\cap B)}{\text{size}(\boldsymbol{\Omega})}P(B)=size(B)size(Ω)P(B)=\displaystyle \frac{\text{size}(B)}{\text{size}(\boldsymbol{\Omega})},所以:

P(AB)=P(AB)P(B)\begin{align} P(A\mid B) = \frac{P(A\cap B)}{P(B)} \end{align}

\label{1} 公式 (1)\eqref{1} 就是条件概率

通过条件概率可以很容易推导出贝叶斯定理

P(AB)=P(AB)P(B)P(BA)=P(AB)P(A)P(AB)P(BA)=P(A)P(B)P(AB)=P(BA)P(A)P(B)\begin{aligned} \displaystyle P(A\mid B) &= \frac{P(A\cap B)}{P(B)} \\ \displaystyle P(B\mid A) &= \frac{P(A\cap B)}{P(A)} \\ &\Downarrow \\ \frac{P(A\mid B)}{P(B\mid A)} &= \frac{P(A)}{P(B)} \\ &\Downarrow \\ P(A\mid B) &= \frac{P(B\mid A)P(A)}{P(B)} \end{aligned}

更深刻理解

虽然上面我们通过推导得到了 贝叶斯定理 但是没有深刻的理解。下面通过一个案例进行说明:

info

Steve 是一个害羞并且性格孤僻,虽然总是乐于助人,但却对周围的人或现实世界不太感兴趣,一个温顺而又井井有条的人,他需要什么事都有理有条,结构清晰并且热衷于钻研细节

你觉得 Steve 是一个图书馆管理员还是 Steve 是一个农民?

我们可能直觉上一下子就会说 Steve 是一个图书馆管理员,但是实际上却是相反,问题是什么?

我们先比较 formula 的描述一下上面的问题

我们设 P(H)P(H) 表示 Steve 是图书馆管理员的概率,而 P(F)P(F) 在这里表示 Steve 是农民的概率;P(E)P(E) 表示一个人符合描述的概率。

tip

很符合事实的概率是

P(EH)P(EF)P(E\mid H) \gg P(E\mid F)

即在图书馆管理员中符合描述的概率远大于农民中符合描述的概率

danger

而误导就发生在此,问题实际上在说的是

P(HE)>?P(FE)P(H\mid E) \overset{?}{> } P(F\mid E)

所以实际上就是在本身 P(H),P(F)P(H),P(F) 的概率下求在知道条件 EE 发生下 后验概率

Untitled.bmp

warning

上图描述在原本 P(H),P(F)P(H),P(F) 比例关系下,得知了 EE 事实的比例变换

那怎么求呢? Untitled.bmp

通过上面图很容易可以看出

P(HE)=图书管理员符合描述人数所有符合描述的人数=P(H)P(EH)P(H)P(EH)+P(F)P(EF)=P(H)P(EH)P(E)P(H\mid E) = \frac{\text{图书管理员符合描述人数}}{\text{所有符合描述的人数}} =\frac{P(H)P(E\mid H)}{P(H)P(E\mid H)+P(F)P(E\mid F)} = \frac{P(H)P(E\mid H)}{P(E)}

而其中的 P(H)P(EH)+P(F)P(EF)P(E)P(H)P(E\mid H)+P(F)P(E\mid F)\Rightarrow P(E) 实际上就是一个全概率公式,实际上不可能符合描述的人只有图书馆管理员和农民,所以我们可以对其推广到普遍意义上。

P(E)=i=1nP(Bi)P(EBi)P(E) = \sum^{n}_{i=1}P(B_{i})P(E\mid B_{i})
info

这里的 BiB_{i} 就是各个类别人群事件

所以同样的我们可以对上面式子进行推广:

P(BiE)=P(Bi)P(EBi)P(E)=P(Bi)P(EBi)j=1nP(Bj)P(EBj)P(B_{i}\mid E) = \frac{P(B_{i})P(E\mid B_{i})}{P(E)} = \frac{P(B_{i})P(E\mid B_{i})}{\sum^{n}_{j=1}P(B_{j})P(E\mid B_{j})}

Bayes Factor

tip

对于医疗检测试剂,具有两个重要指标 Untitled(1).bmp

其中的 TP,FP,FN,TN 第一个字母说明预测正确与否,True(T), False(F),第二个字母说明预测值 Positives(P), Negatives(N)

例如:

  • TP:就是预测阳性预测对了
  • FP:就是预测阳性预测错了
warning
  • Sensitivity,(True Positive Rate)\text{Sensitivity,(True Positive Rate)}
TPR=TPTP+FN\operatorname{TPR} = \frac{TP}{TP+FN}
  • Specificity,(Ture Negative Rate)\text{Specificity,(Ture Negative Rate)}
TNR=TNFP+TN\operatorname{TNR} = \frac{TN}{FP+TN}
  • False Positive Rate\text{False Positive Rate}
FPR=FPFP+TN\operatorname{FPR} = \frac{FP}{FP+TN}
info

假设现在有个人通过检测,检测出了阳性,已知该病发病率1%1\%,该检测的敏感度90%90\%假阳率9%9\%.

1%1:991\% \Rightarrow 1:99

我们首先把原来的发病率转化成比率 1:991:99

所以在已知阳性后,需要乘以各自的 " 真阳性率 "

(# With )(# Without )(# With )P(+ Cancer )# (Without )P(+ No cancer )\frac{(\# \text { With })}{(\# \text { Without })} \Rightarrow \frac{(\# \text { With }) \cdot P(+\mid \text { Cancer })}{\# \text { (Without }) \cdot P(+\mid \text { No cancer })}

而这里的 P(+ Cancer )P(+ No cancer )\displaystyle \frac{P(+\mid \text { Cancer })}{P(+\mid \text { No cancer })} 就是 Bayes Factor\text{Bayes Factor},或者叫似然比

很显然在这里,似然比就等于

P(+ Cancer )P(+ No cancer )=Sens.FPR.=10\frac{P(+\mid \text { Cancer })}{P(+\mid \text { No cancer })} = \frac{\text{Sens.}}{\text{FPR.}} =10

所以在检测出阳性的事实下 " 发病率 " 更新为了

1:9910:99=101091111:99 \Rightarrow 10:99 = \frac{10}{109} \approx \frac{1}{11}

所以更加 formula 的阐述就是,在检测之后的患病比率等于检测前的比率 (也就是先验概率) 乘以贝叶斯因子

O(D+)=O(D)P(+D)P(+¬D)O(D\mid +) = {\color{Red} O(D)} \frac{P(+\mid D)}{P(+ \mid \neg D)}
info

这里的 O()O(\cdot) 表示概率的比率表示

所以这里贝叶斯定理能够强调公式的哪些部分是来自先验部分,哪些是来自统计数据部分

相关资料