用贝叶斯推断破解谋杀谜案

Ctrl+D 收藏本站再次访问不迷路 ~

📰 来源：Towards Data Science　|　📅 翻译日期：2026年6月1日
🔗 原文：查看原文
🤖 翻译：DeepSeek AI · 仅供参考

引言

我还记得观看好莱坞悬疑惊悚片《利刃出鞘》时，身体前倾，仿佛这案子是我要破解的。当侦探布兰科的团队审问斯隆比庄园的每个人时，我也在脑中划掉一个又一个名字，又在剧情转折后重新列入。那时我从未意识到，这部老派的"谁干的"谜案其实在让我做数学计算。虽然这听起来有些牵强，但我强烈感觉到贝努瓦·布兰科的调查风格与贝叶斯推断非常相似。不过，记得电影中审讯场景的人会很快意识到，布兰科甚至没有主动审讯。他坐在钢琴旁，让他的团队（埃利奥特中尉和瓦格纳骑警）提问。那么为什么我说布兰科的调查风格与贝叶斯推断有关呢？布兰科自己在电影中提到了这一点，我引用一下：

"我观察事实，不带头脑或心灵的偏见。" (贝努瓦·布兰科，《利刃出鞘》[1])

这正是贝叶斯推断的精髓——你的结论不是由直觉驱动，而是由证据驱动。让我们一起用贝叶斯推断来破解这个谋杀谜案。

快速说明：在整个电影中，矛盾以两种形式呈现。一种是以闪回形式呈现的矛盾，只展示给观众，布兰科大多不知情。另一种是调查中布兰科目睹的口头不一致所揭示的矛盾。因此，我们只关注布兰科注意到的口头不一致。

另外，关于概率权重分配和更新：这些不是用贝叶斯公式计算的，因为对行为证据（如回避行为或撒谎）很难分配似然值。相反，我们使用有根据的估计作为教学工具，而非数学证明。希望你喜欢这段旅程。

建立初始信念

布兰科侦探被一位家族成员匿名雇佣，调查哈兰·斯隆比是否被谋杀的可能性。当他的团队开始审讯时，布兰科在后方静静观察潜在嫌疑人。当审讯偏离方向时，他通过敲击钢琴键重新引导团队。

他观察到每一次互动都充满了谎言和矛盾。他做得对的是：不因直觉而抛弃一个叙述，也不因直觉而坚持另一个。他明白误导性的陈述可能包含真相的碎片。他仔细评估每次互动，为每个观察分配权重，然后综合得出结论。他从不确定开始，但慢慢构建出最可能的真相，同时撇开个人偏见。

布兰科首先列出了可能的死因。在贝叶斯世界中，这被称为先验模型。先验模型是我们在获得任何证据之前所持有的假设集合。在本例中，先验模型是调查开始前关于斯隆比之死的初始假设。

评估初始信念的完备性

让我们评估初始信念，看看是否遗漏了其他可能性。我们是否忽略了这是栽赃陷害的可能性？如果是，是否应该将其列为第六个假设？

这正是贝叶斯推断中制定假设的最重要原则（MECE原则）发挥作用的地方。作为贝叶斯推断一部分的每个假设应该是相互独立且完全穷尽的。

让我们重新审视第六个潜在假设——"试图栽赃陷害"。虽然所选假设应回答死亡原因，但这个潜在假设更多是在谈论动机（前提是已证明是谋杀）。因此，它违反了MECE原则的相互独立性，不能直接作为假设。

分配概率（先验概率）

让我们坚持之前制定的假设，因为它们考虑了所有可能的死因（完全穷尽）。下一步合乎逻辑的是为我们的初始信念分配概率。这意味着我们从对每种假设导致哈兰·斯隆比死亡的可能性进行有根据的猜测开始。由于我们在获得任何直接证据或数据之前分配概率，我们称之为先验概率。下图显示我们为所有假设分配了相等的权重。让我们暂时假设这些是我们的先验概率。

一个自然浮现的问题是：每个假设是否具有相同的发生概率？不，并非总是如此。这是贝叶斯推断中的一个常见误解——必须为所有假设分配相等的概率。在没有先验证据的情况下，我们假设布兰科侦探为每个假设分配了相等的概率。但事实并非总是如此。

如果我们有先验知识表明某个假设比其他假设更可能，我们也可以假设非均匀（不等）概率。一般犯罪统计数据也可能有助于估计先验概率。例如，根据FBI杀人数据[2]，大多数杀人案中，受害者认识凶手。外部人员的杀人通常涉及盗窃或某种报复的动机。因此，假设4（家庭成员） 获得更高权重，因为家庭成员更容易接触到受害者。此外，在哈兰·斯隆比的案件中，家庭成员造成的死亡假设权重更大，因为他的家人可能受到继承财富和遗产的驱使。我们情景下的理想先验概率应是非均匀分布。