条件概率
条件概率一般记作 P(A∣B),意思是当 B 事件发生时,A 事件发生的概率,其定义为
P(A∣B)=P(B)P(A∩B)
其中 P(A∩B) 意思是 A 和 B 共同发生的概率,称为联合概率。也可以写作 P(A,B) 或 P(AB)。
如何对他有更深刻的认识呢?
当我们说 A 发生的概率 P(A),实际上就是说在 样本空间
中,事件 A 发生的数量占 Ω 的比率。
条件概率中的 P(A∣B) 意思是事件 B 发生的情况下,事件 A 发生的概率,所以此时 P(A∣B) 已经不是针对于样本空间 Ω 而是缩小的样本空间 B。
结合上图来讲就是,条件概率 P(A∣B) 就是
P(A∣B)=size(B)size(A∩B)
考虑到 P(A∩B)=size(Ω)size(A∩B),P(B)=size(Ω)size(B),所以:
P(A∣B)=P(B)P(A∩B)
公式 (1) 就是条件概率
通过条件概率可以很容易推导出贝叶斯定理
P(A∣B)P(B∣A)P(B∣A)P(A∣B)P(A∣B)=P(B)P(A∩B)=P(A)P(A∩B)⇓=P(B)P(A)⇓=P(B)P(B∣A)P(A)
更深刻理解
虽然上面我们通过推导得到了 贝叶斯定理
但是没有深刻的理解。下面通过一个案例进行说明:
Steve 是一个害羞并且性格孤僻,虽然总是乐于助人,但却对周围的人或现实世界不太感兴趣,一个温顺而又井井有条的人,他需要什么事都有理有条,结构清晰并且热衷于钻研细节
你觉得 Steve
是一个图书馆管理员还是 Steve
是一个农民?
我们可能直觉上一下子就会说 Steve
是一个图书馆管理员,但是实际上却是相反,问题是什么?
我们先比较 formula 的描述一下上面的问题
我们设 P(H) 表示 Steve
是图书馆管理员的概率,而 P(F) 在这里表示 Steve
是农民的概率;P(E) 表示一个人符合描述的概率。
很符合事实的概率是
P(E∣H)≫P(E∣F)即在图书馆管理员中符合描述的概率远大于农民中符合描述的概率
而误导就发生在此,问题实际上在说的是
P(H∣E)>?P(F∣E)
所以实际上就是在本身 P(H),P(F) 的概率下求在知道条件 E 发生下 后验概率。
上图描述在原本 P(H),P(F) 比例关系下,得知了 E 事实的比例变换
那怎么求呢?
通过上面图很容易可以看出
P(H∣E)=所有符合描述的人数图书管理员符合描述人数=P(H)P(E∣H)+P(F)P(E∣F)P(H)P(E∣H)=P(E)P(H)P(E∣H)
而其中的 P(H)P(E∣H)+P(F)P(E∣F)⇒P(E) 实际上就是一个全概率公式,实际上不可能符合描述的人只有图书馆管理员和农民,所以我们可以对其推广到普遍意义上。
P(E)=i=1∑nP(Bi)P(E∣Bi)
这里的 Bi 就是各个类别人群事件
所以同样的我们可以对上面式子进行推广:
P(Bi∣E)=P(E)P(Bi)P(E∣Bi)=∑j=1nP(Bj)P(E∣Bj)P(Bi)P(E∣Bi)
Bayes Factor
对于医疗检测试剂,具有两个重要指标
其中的 TP,FP,FN,TN
第一个字母说明预测正确与否,True(T), False(F)
,第二个字母说明预测值 Positives(P), Negatives(N)
例如:
TP
:就是预测阳性预测对了
FP
:就是预测阳性预测错了
- Sensitivity,(True Positive Rate)
TPR=TP+FNTP
- Specificity,(Ture Negative Rate)
TNR=FP+TNTN
- False Positive Rate
FPR=FP+TNFP
假设现在有个人通过检测,检测出了阳性,已知该病发病率为 1%,该检测的敏感度为 90%,假阳率为 9%.
1%⇒1:99我们首先把原来的发病率转化成比率 1:99
所以在已知阳性后,需要乘以各自的 " 真阳性率 "
(# Without )(# With )⇒# (Without )⋅P(+∣ No cancer )(# With )⋅P(+∣ Cancer )而这里的 P(+∣ No cancer )P(+∣ Cancer ) 就是 Bayes Factor,或者叫似然比
很显然在这里,似然比就等于
P(+∣ No cancer )P(+∣ Cancer )=FPR.Sens.=10所以在检测出阳性的事实下 " 发病率 " 更新为了
1:99⇒10:99=10910≈111
所以更加 formula 的阐述就是,在检测之后的患病比率等于检测前的比率 (也就是先验概率) 乘以贝叶斯因子
O(D∣+)=O(D)P(+∣¬D)P(+∣D)
这里的 O(⋅) 表示概率的比率表示
所以这里贝叶斯定理能够强调公式的哪些部分是来自先验部分,哪些是来自统计数据部分
相关资料