贝叶斯主义拯救盟军

第二次世界大战打响之时,学术界的统计学家都是反贝叶斯主义者。但在学术界以外,统计学的地位也不怎么样。英国政府认识到破译纳粹密码可能成为战争的关键,他们为此优先聘请的是文字工作者、艺术家和历史学家。幸运的是,英国数学家也加入进来,他们自称物理学家来博取英国政府的关注。相反,统计学家却被忽略了。这可能是件好事,因为被这些“真正”的统计学家唾弃的贝叶斯公式将成为此次行动的关键。

第二次世界大战用的是一种新的密码术,也就是机械密码。纳粹军队专用的密码机叫作恩尼格玛密码机(Enigma)。恩尼格玛密码机与打字机类似,其特点是将输入内容加密并打印出来。更妙的是,要解密某段密码,只需要将它输入机器即可 [4]

好吧,并不完全是这样。这种机器的加密和解密方式依赖于机器配置。纳粹军队每天都会使用不同的机器配置,然而,恩尼格玛密码机在出厂时就包含上百万个配置方式。更大的问题在于纳粹军队手中的机器还有额外的功能,可以大大扩充恩尼格玛密码机的可能配置总数,差不多有数万兆( )种。要测试所有这些配置简直是痴心妄想。

在温斯顿·丘吉尔等人的推动下,英国政府逐步了解到,数学将是破译这些敌方密码的关键。在布莱切利园,一支梦之队就此结成,其中包括了彼得·特温、戈登·韦尔什曼、德里克·汤特、比尔·塔特、马克斯·纽曼、杰克·古德,当然最重要的还是伟大的艾伦·图灵。

我们会在之后的章节中谈到图灵在 1936 年关于可计算性理论的大量发现。但当时,正如电影《模仿游戏》(Imitation Game)中描述的那样,图灵很快理解了应该如何将大量计算步骤自动化,从而破译恩尼格玛密码机。这让他能够建造名为“炸弹”(Bombe)的机器,这种机器每天都能破译纳粹陆军和空军的密码。然而,纳粹海军用到了更高级的恩尼格玛密码机,而要破译它的话,“炸弹”的速度不够。更糟糕的是,纳粹当局用的密码更为复杂,其原型不是恩尼格玛密码机,而是洛仑兹(Lorenz)密码机。

图灵接受的第一个挑战就是说服英国当局,无论是纳粹海军的恩尼格玛密码机还是纳粹当局的洛仑兹密码机,都是可以破译的,而且,破译这些密码的投资并不会毫无回报。英国当局在很长一段时间内并不信服。这些密码似乎过于复杂,而要破译它们,无论是在时间、人力还是硬件上都要付出高昂的代价。然而图灵的结论是,这些都是值得的。

丘吉尔最后被说服了。他后来承认:“战争中唯一真正令人恐惧的,就是(纳粹海军的)潜水艇带来的危险。”这些潜水艇已经击沉了大量从大洋彼岸驶来的补给船舶。杰里·罗伯茨上尉补充道,如果这种情况长期持续下去的话,“英国可能,甚至非常可能陷入饥荒并输掉战争”。而破译洛仑兹密码机则可以让英国直接知晓阿道夫·希特勒的意图与策略,特别是有助于知道他究竟预计英军会在法国加莱还是诺曼底登陆。

图灵的研究得到了绿灯放行,接下来就要找到正确的想法了。你可能猜到了,答案就是贝叶斯公式。图灵找到了一种试探性的方法,能以定量的方式应用贝叶斯公式。图灵用的单位叫班伯里(banburismus),简称班(ban)——这其实是一座城市的名字,它提供了用于尽可能将相关计算自动化的物资。战争落下帷幕之后,图灵于战争期间在美国遇见过的一位数学家克劳德·香农提出了班伯里的一种变体,赋予它一个今天人们耳熟能详的名字:比特(bit)。我们之后会再谈到这一点。

现在,我们先回到图灵和第二次世界大战。每当某个恩尼格玛密码机的配置方式似乎能够部分解码某条信息的时候,这个配置就会获得班伯里值,或者说是贝叶斯置信度。图灵将不同配置方式的班伯里值结合起来考虑,就能够将搜索引导到优先测试更有希望的配置上。我在这里大大简化了对相关过程的叙述,但这个过程的确能让解码速度大大提高。最后,图灵及其同事与他们的机器逐渐能够解读纳粹的大部分信息。

历史学家哈里·欣斯利断言,英国数学家的工作“将战争缩短了至少两年,甚至四年”。有人甚至认为,如果没有他们的话,战争的结果并不明朗。更无可非议的是,图灵和同事的数学工作,以及对贝叶斯公式的适时应用,拯救了数千万人的生命。

然而,战争落下帷幕之后,这一切都被保密。温斯顿·丘吉尔用尽一切办法确保这种保密状态。他下令销毁所有可能暗示纳粹密码曾被破译的文件,并将贝叶斯公式(以及图灵的那些机器)深深地埋藏了起来。