中文版序

本书第一版在意大利上市后,没过几个月,新冠病毒的出现和新冠疫情的暴发迅速改变了我们所知的世界。这场疫情促使技术的应用空前加速,数据和算法在全球应对新冠疫情的过程中发挥了关键作用。由此,我们逐渐认识到,数据和算法的价值远远超出商业领域,它们可以直接影响生死。诸如“具有社会影响的数据”这样的短语,在我们亲身体验了这种影响之后,已经被赋予了更具体的意义。

在新冠疫情期间,通过数据和算法预测未来,于我们而言似乎越发出乎意料或者说刷新认知,而本书所讨论的许多场景和情况也有如预言一一应验。书中描述的那些科学进展在这场疫情中接受了考验。如果我们考察一些专业研究组的工作,就会发现,通过数据和算法,人们已经对这场大流行病有了诸多了解,而且往往是提前了解。模型和算法已经证明了其自身的价值。例如,在新冠大流行的初期,专家便基于模型对新冠疫情的国际传播趋势进行了准确的分析,并就这场大流行病的风险向国际社会发出了重要预警。紧接着,专家运用数据和算法来描述新冠病毒无症状/有症状传播的可能性,并在检测能力极其有限的情况下估计实际的感染者数量。这类工作多年来一直以“预报”和“情景模拟”的方式进行,它们只是现代计算流行病学工作的一小部分,但已经成为流行病管理中的重要工具。它们在每一波新的感染潮到来前敲响警钟,分析管控措施的影响,并评估每个毒株变体出现后对疫情发展轨迹的影响。以奥密克戎变异株引发的新一波感染潮为例,截至2021年12月中旬,已经有专家预测到这一波的感染数量会增加,而且规模会远超之前。

本书有几章专门介绍了在大流行病期间,数字化带来的数据流、算法和模型是如何被用于生成各种有关流行病的资讯的。令人遗憾的是,在新冠大流行期间,科学研究成果和信息的传播与一些毫无依据的说法交织在一起,从预测疫情结束的确切日期到每一波感染潮的具体情况,仿佛每一波感染高峰都是按照计划到来和消退。往好了说,这些分析和理论由于缺乏计算流行病学的基本知识而不免有些天真。往坏了说,它们就如同永动机理论,错得无可救药。那些毫无依据的说法充斥着整个社交网络,有些甚至在主流媒体上占据一席之地,它们不仅不能帮我们看清形势,反而会干扰我们的理解,让公众感到更加困惑。这种误导性信息产生的后果显而易见,并且引人深思。我们有多少次听到这样的话语:“他们什么都不理解,更什么都不能预测。”

通过阅读后面的章节,你会发现,无论是认为疫情期间无法进行准确预测,还是认为在其他某些领域无法进行准确预测,这些观点都是不符合实际的。模型和算法的运用,将数据从静态的系统快照转化为具有预测能力的动态要素。你会了解到,当我们将针对未来情景的假设进行形式化处理,以及对未来可能发生的情况创建推理路径时,模型和算法仍然为我们提供了最佳工具。不过,你同时也会了解到,模型和算法并非神谕,它们只能基于特定时间的假设和可获得的数据,针对未来可能发生的情况进行预测,而且预测的结果必须随着科学知识的更新和决策政策的变更而不断修正,以确保预测科学的可重复性和可靠性。模型构建者和决策制定者的通力合作是关键。对所有可能存在的不确定性、假设以及方法的局限性保持透明是十分必要的。这种合作使我们能够清楚地看待模型和算法所描绘的未来世界的图景,并在此基础上及时做出决策,理性地评估不确定性和风险。这一过程看似混乱,却是掌握可靠的科学预测方法和做出明智决策的必由之路。

事实上,过去几年,我们已经非常清楚地看到,围绕数据和算法的使用产生的大多数问题源于人们对它们的能力和局限性普遍存在误解。尽管有望运用新技术应对危机,但我们尚未充分发挥出它们的潜力。比如,在这次的新冠疫情管控过程中,海量的数据被生成,可并未得到充分利用。数字化接触者追踪、病毒基因组测序和掌握人口流动数据都是可实现的,但我们的社会并未做好利用它们的准备。如果不能将数据和算法转化成实用的见解和知识,那么它们将毫无用处。接下来,我想表达的是,在解锁数据和算法带来的新认知时,人们会遇到的一大障碍就是将复杂的图景过度简化——将有关算法和人工智能的复杂讨论归于简单的未来主义场景,即仿生人形机器人大军究竟会拯救人类还是会奴役人类。

如今,人工智能越发拟人化,这种倾向在人们与聊天机器人(比如ChatGPT)的互动中更加明显。我们将它们当作有认知能力和情感的对象进行沟通,紧接着,我们开始担心它们会夺走我们的工作,继而会取代我们。也有人认为,人工智能会成为我们绝佳的守护者,但这是一个很大的误解。人工智能只不过是一系列“算法”,具体而言就是一系列精确的指令和数学表达式,我们用以明确信息间的关联,识别事物的发展趋势,总结人类行为背后的规律和动机。人工智能就像是一面镜子,能够映照出人类的所有美德和偏见。算法只有在与人类的互动中才被赋予意义,并基于人类持续产生的数据自我优化。智能算法能够频繁记录我们购买的产品,通过GPS(全球定位系统)标注来追踪我们的行动,用情绪信号实时分析我们的对话。算法通过将我们的数据与其他数百万人的数据进行比较,从而描绘出我们的心理画像,更好地预测我们的音乐、文学以及电影品位。

人工智能只有基于我们所生成的数据不断优化,才能更好地分析我们的现在,预测我们的未来。因此,人类和人工智能处于一个共生的过程中,二者的结合产生了“增强智能”(Augmented Intelligence)。由此,人类获得了新的力量:能够在几秒钟内筛选出堆积如山的数据,能够迅速找到答案,能够预测未来。算法也变得越发强大和准确,它紧紧贴合着我们,就像我们量身定做的衣服一样。这两种智能互相增强。而且,这种“增强”的过程并不只存在于个人层面。在整个社会层面,基于数据和算法的大型计算机模型能够对数百万甚至数十亿人的日常生活、行为和互动进行模拟分析,这为我们实施政治规划和危机管理提供了崭新的工具。这些基于模型造就的人工社会,能够帮助我们分析各类事件发生的情景,譬如疫情会从何时何地开始传播、地区冲突何时出现、一场金融危机有多大可能会爆发,并在此基础上评估风险,制定相应的干预政策。

我们在此探讨“增强智能”而非“人工智能”,并非要咬文嚼字,而是要将人类重新拉回我们正在经历的这场革命的中心,使人们脱离科幻小说的影响,转而关注当下世界。在当下世界,算法与人工智能正在增强人类的能力,而不是取代人类。在当下世界,我们显然并未受到所谓的“杀手机器人”的威胁,却经受着因使用和控制算法的能力存在差异而导致的社会经济不平等。在当下世界,我们正经历着政治和经济力量的再平衡,而这种再平衡是具有划时代意义的。在当下世界,只有少数政府、组织或团体掌握了基于算法进行预测的能力,能够看清现在和未来的图景,大多数则还在黑暗中苦苦摸索。但最重要的是,我们必须重塑教育系统,改革学校和培训制度。要培养人们的计算素养,解放人们的创造力,不要让人们面对掌握在少数精英手中的算法时毫无防备,盲目崇拜。在当下世界,威胁我们的可不是什么“杀手机器人”,而是人类在漫长的历史上一直存在的问题——短视。我们必须认识到,人类社会已经进入全新的“增强智能”时代,一切都将改变。

我们必须意识到,不久之后,我们将不得不应对很可能比新冠疫情更严峻、更紧迫的问题。人类将不得不应对气候变化、人机交互、资源枯竭、环境退化、人口过剩以及社会不平等加剧等问题。无论我们接受与否,这都是人类在新时代必然面临的挑战。掌握数据并能够基于适当的模型和算法读懂数据,才是解决这些问题的开端。

亚历山德罗·韦斯皮尼亚尼
2023年2月
于波士顿