贝叶斯统计是统计学知识的基础。接下来的章节中我选用了教材《趣学贝叶斯统计:橡皮鸭、乐高和星球大战中的统计学》。该书旨在帮助你开始用数学的方式思考问题,但不需要大量的数学背景知识。读完本书,你可能会发现自己不经意地写出了方程来描述在日常生活中看到的问题。
用途:
步骤:
(1) 观察到了数据;
(2) 做出了一个假设;
(3) 根据观察到的数据更新了自己的信念。
P
(
D
∣
X
)
=
很大
P\left(D \mid X\right)=很大
P(D∣X)=很大
P
(
D
∣
X
)
=
很小
P\left(D \mid X\right)=很小
P(D∣X)=很小
窗外出现亮光, 天空中有碟形物体,让人很惊讶。
P
(
窗外出现亮光
,
天空中有碟形物体
)
=
很小
P(窗外出现亮光, 天空中有碟形物体)=很小
P(窗外出现亮光,天空中有碟形物体)=很小
在概率论中,当要表示多个事件的联合概率(combined probability)时,用逗号分隔事件。
先验信念是我们根据一生的经验(也就是观察到的数据)建立起来的信念集合。
P
(
窗外出现亮光,天空中有碟形物体
∣
地球上的经验
)
很小
P (窗外出现亮光,天空中有碟形物体 | 地球上的经验)很小
P(窗外出现亮光,天空中有碟形物体∣地球上的经验)很小
解释:
如果有一个以上的变量会显著影响概率,那么我们可以添加一个以上的先验信念。
P ( 窗外出现亮光 , 天空中有碟形物体 ∣ 特定节日 , 地球上的经验 ) 小 P(窗外出现亮光, 天空中有碟形物体 | 特定节日, 地球上的经验)小 P(窗外出现亮光,天空中有碟形物体∣特定节日,地球上的经验)小
为了解释所看到的情况,我们需要形成某种假设(hypothesis),即形成一个关于世界如何运作的模型,从而做出预测。 因为预测了数据,所以当我们在给定的假设下观察到数据时,数据的概率就会增加。
P
(
D
∣
H
1
,
X
)
>
>
P
(
D
∣
X
)
P\left(D \mid H1,X\right)>>P\left(D \mid X\right)
P(D∣H1,X)>>P(D∣X)
假设 D 表示一个患者患有某种疾病,H1 表示患者具有某种遗传因素,X 表示其他相关的临床观察。那么,公式可以解释为,在了解了患者的遗传因素 H1 后,观察到的临床症状 X 使得患病的可能性更高。
为了进一步提高知识水平以得出更可靠的结论,你需要收集更多的数据。这是统计推理的下一个步骤,也是直觉思维的下一个步骤。由此产生了备择假设(alternative hypothesis)。思考备择假设的过程,就是利用你所掌握的数据对多种假设进行比较的过程。
P ( D ∣ H 2 , X ) > > P ( D ∣ H 1 , X ) P\left(D \mid H2,X\right) >> P\left(D \mid H1,X\right) P(D∣H2,X)>>P(D∣H1,X)
在给定观察X的条件下,考虑H2的信息后,事件D的概率远远大于在考虑H1后的概率。
在某个医学研究中,D代表治疗成功,H1和H2表示两种不同的治疗方法。在给定X的情况下,如果H2方法更有效,那么 P ( D ∣ H 2 , X ) P\left(D\mid H2,X \right) P(D∣H2,X)会显著大于 P ( D ∣ H 1 , X ) P\left(D\mid H1,X \right) P(D∣H1,X)。
P ( D 更新后 ∣ H 2 , X ) P ( D 更新后 ∣ H 1 , X ) \frac{P\left(D更新后\mid H2,X\right)} { P\left(D更新后 \mid H1,X\right)} P(D更新后∣H1,X)P(D更新后∣H2,X)?
如果这个比值大于1,表示 H2 提供的先验信息更支持新证据 X 对事件 D 的发生产生影响,相比于 H1。
贝叶斯分析的真正核心:检验信念的标准是它们解释世界的能力。 数学上用这两种概率的比值来表达这个想法:
数据影响信念,信念不应该影响数据
我们应当根据所收集到的数据和对世界的观察来改变自己的信念,从而更恰当地描述这个世界。而不是收集数据来支持自己当前的信念。贝叶斯思维就是改变你的想法,更新你对世界的理解。我们观察到的数据都是真实的,所以我们的信念终归需要转变,直到与数据一致。