📰 来源:Towards Data Science | 📅 翻译日期:2026年6月1日
🔗 原文:查看原文
🤖 翻译:DeepSeek AI · 仅供参考
引言
我还记得观看好莱坞悬疑惊悚片《利刃出鞘》时,身体前倾,仿佛这案子是我要破解的。当侦探布兰科的团队审问斯隆比庄园的每个人时,我也在脑中划掉一个又一个名字,又在剧情转折后重新列入。那时我从未意识到,这部老派的"谁干的"谜案其实在让我做数学计算。虽然这听起来有些牵强,但我强烈感觉到贝努瓦·布兰科的调查风格与贝叶斯推断非常相似。不过,记得电影中审讯场景的人会很快意识到,布兰科甚至没有主动审讯。他坐在钢琴旁,让他的团队(埃利奥特中尉和瓦格纳骑警)提问。那么为什么我说布兰科的调查风格与贝叶斯推断有关呢?布兰科自己在电影中提到了这一点,我引用一下:
"我观察事实,不带头脑或心灵的偏见。" (贝努瓦·布兰科,《利刃出鞘》[1])
这正是贝叶斯推断的精髓——你的结论不是由直觉驱动,而是由证据驱动。让我们一起用贝叶斯推断来破解这个谋杀谜案。
快速说明:在整个电影中,矛盾以两种形式呈现。一种是以闪回形式呈现的矛盾,只展示给观众,布兰科大多不知情。另一种是调查中布兰科目睹的口头不一致所揭示的矛盾。因此,我们只关注布兰科注意到的口头不一致。
另外,关于概率权重分配和更新:这些不是用贝叶斯公式计算的,因为对行为证据(如回避行为或撒谎)很难分配似然值。相反,我们使用有根据的估计作为教学工具,而非数学证明。希望你喜欢这段旅程。
建立初始信念
布兰科侦探被一位家族成员匿名雇佣,调查哈兰·斯隆比是否被谋杀的可能性。当他的团队开始审讯时,布兰科在后方静静观察潜在嫌疑人。当审讯偏离方向时,他通过敲击钢琴键重新引导团队。
他观察到每一次互动都充满了谎言和矛盾。他做得对的是:不因直觉而抛弃一个叙述,也不因直觉而坚持另一个。他明白误导性的陈述可能包含真相的碎片。他仔细评估每次互动,为每个观察分配权重,然后综合得出结论。他从不确定开始,但慢慢构建出最可能的真相,同时撇开个人偏见。
布兰科首先列出了可能的死因。在贝叶斯世界中,这被称为先验模型。先验模型是我们在获得任何证据之前所持有的假设集合。在本例中,先验模型是调查开始前关于斯隆比之死的初始假设。
评估初始信念的完备性
让我们评估初始信念,看看是否遗漏了其他可能性。我们是否忽略了这是栽赃陷害的可能性?如果是,是否应该将其列为第六个假设?
这正是贝叶斯推断中制定假设的最重要原则(MECE原则)发挥作用的地方。作为贝叶斯推断一部分的每个假设应该是相互独立且完全穷尽的。
让我们重新审视第六个潜在假设——"试图栽赃陷害"。虽然所选假设应回答死亡原因,但这个潜在假设更多是在谈论动机(前提是已证明是谋杀)。因此,它违反了MECE原则的相互独立性,不能直接作为假设。
分配概率(先验概率)
让我们坚持之前制定的假设,因为它们考虑了所有可能的死因(完全穷尽)。下一步合乎逻辑的是为我们的初始信念分配概率。这意味着我们从对每种假设导致哈兰·斯隆比死亡的可能性进行有根据的猜测开始。由于我们在获得任何直接证据或数据之前分配概率,我们称之为先验概率。下图显示我们为所有假设分配了相等的权重。让我们暂时假设这些是我们的先验概率。
一个自然浮现的问题是:每个假设是否具有相同的发生概率?不,并非总是如此。这是贝叶斯推断中的一个常见误解——必须为所有假设分配相等的概率。在没有先验证据的情况下,我们假设布兰科侦探为每个假设分配了相等的概率。但事实并非总是如此。
如果我们有先验知识表明某个假设比其他假设更可能,我们也可以假设非均匀(不等)概率。一般犯罪统计数据也可能有助于估计先验概率。例如,根据FBI杀人数据[2],大多数杀人案中,受害者认识凶手。外部人员的杀人通常涉及盗窃或某种报复的动机。因此,假设4(家庭成员) 获得更高权重,因为家庭成员更容易接触到受害者。此外,在哈兰·斯隆比的案件中,家庭成员造成的死亡假设权重更大,因为他的家人可能受到继承财富和遗产的驱使。我们情景下的理想先验概率应是非均匀分布。
收集证据并更新信念
审讯开始后,布兰科从家庭成员的供述中捕捉到不一致之处。他不断用新证据更新自己的信念。这被称为似然更新。
例如,当孙女梅格声称自己当晚没有离开房间时,布兰科注意到她的话语中带有紧张。他将此视为一个轻微的证据,降低了对"自然原因"假设的信任度,同时增加了"谋杀"假设的概率。
结论
通过逐步积累证据并更新先验概率,布兰科最终得出了最可能的真相:哈兰·斯隆比是被家庭成员谋杀的。这正是贝叶斯推断的核心——从不确定性出发,通过证据不断修正概率,最终逼近真相。
参考资料
- Knives Out, directed by Rian Johnson, 2019.
- FBI Homicide Data, 2020.
评论已关闭