1.4 当前热点与挑战

在这一部分我们将扼要论述未来的研究挑战。

1.4.1 超大规模分布式人工智能系统

我们的世界包含着许多超大规模的分布式系统,比如一个城市的所有红绿灯系统,协调城市的所有车辆避免交通堵塞。这些超大规模的分布式系统普遍且重要,而如今人们对此的解决方案大多还是经验性的。在未来的研究中,人们会更多地关注超大规模的分布式系统。大规模分布式系统为分布式人工智能带来的一大挑战就是其可能出现的状态和可能采取的决策都随着系统规模呈指数级增长,如何找到最优或者有效的策略是极度困难的。为了应对这个挑战,研究者提出的方法大致可以分为如下三个方向:①对大规模系统进行抽象和近似,如将平均场理论应用于分布式系统[95],但平均场理论所处理的场景是非原子性的,即其忽略了每个个体的差异性而只关注大量个体构成的分布,而多智能体系统的智能体是原子性的,需要指定不同个体的行为,这两个领域的方法在理论和应用上都有不同,需要研究者更多的研究。②利用离线训练来减少训练所需的时间,离线数据能够在训练中使得模型具有相应的领域知识,避免从随机初始化的状态开始训练所带来的对大量训练数据的需求,但是离线数据的质量是很重要的,如果质量不够好,反而会发生负向迁移,离线训练模型的在线泛化和安全性也是研究的一大热点[29]。③将大规模系统分为小规模系统并利用通信进行分布式训练,这类训练范式随着分布式训练和联邦学习的发展获得了长足的进步,但是联邦学习依然不是绝对安全的,因而隐私和安全问题及在超大规模情况下如何进行有效的协调依然是当下和未来的研究热点[99]

1.4.2 分布式人工智能系统的鲁棒性和安全性

利用算法来指导现实世界中的决策能够提升效率和表现,但同时带来了一些担忧,尤其是以深度学习和深度神经网络为基础的算法,其对于现实世界中可能存在的扰动、不确定性甚至蓄意的攻击都可能带来可怕的后果。许多研究表明,深度学习模型对扰动是不够鲁棒的,所以当下研究的一大热点是提升算法的鲁棒性和安全性,让它们能够在不确定性甚至对抗性的决策环境中都能够做出相对较好的决策。因此研究者主要采用的方法有:①对抗训练。针对深度学习模型的脆弱性,研究者首先提出了以对抗训练来提升模型的鲁棒性,其假定有对抗者会采取对于决策者最差的行为来对环境和问题进行扰动,然后决策者需要求解最大化最小收益的策略。近来的相关进展包括如何将深度学习模型拓展到训练时没有见过的攻击手段,以及如何应对多重攻击手段的综合攻击[82]。②安全决策[28]。不同于模型的鲁棒性,安全性是深度学习模型应用于现实世界需要考虑的问题,其要求不仅需要计算决策策略,还需要根据专业知识评估策略的风险性,并且在应用过程中对风险性进行感知和控制,因为基于数据训练的深度学习模型对于一些不常出现的场景很难提供合理的处理决策,如百年一遇的暴雨或者洪水,这都需要人工介入来提升模型的安全性。

1.4.3 分布式人工智能决策的可解释性

基于深度学习的分布式人工智能方法虽然在许多问题上带来了令人兴奋的进展,但是深度学习的“黑箱”性质也对研究者提出了增加模型可解释性的要求。可解释性指算法在得到决策的同时,应当解释为什么做这种决策,这对于算法应用在现实世界中,尤其是有人合作参与或者监督的场景下至关重要。为解决算法决策的可解释性问题,研究者在模型中引入了因果推断模型和表征学习模型来对决策所依据的表征进行表示,让人们能够理解算法做出的决策。相关的解决思路包括:①因果推断,这是图灵奖得主Yoshua Bengio在最近的研究中推动的对于可解释性的技术思路,其主要想法是将传统的因果关系表述引入深度学习模型,并将其表述成为人类可以理解的因果关系模型[73]。②分层目标,对于序贯的多步决策,如果能够理解智能体在每一步的决策目标是很重要的,分层目标能够显示出智能体在达成一个大目标的过程中每个阶段执行的小目标,这可以极大地加强人类对于智能体决策的理解[51]

1.4.4 将传统和深度学习的方法结合

将深度学习方法应用于分布式人工智能是当前研究的一大趋势,并且取得了一定的成果。但需要注意的是,深度学习方法有其弊端,主要体现在:①需要大量的数据,而在机器人领域中,数据量一般是比较小的;②大量的算力,这在一些边缘设备(edge devices)(如手机)上是无法满足的;③缺乏理论保证(例如解的最优性),这使得它在一些对精度要求较高的领域无法使用。与此相反,传统方法可以在一定程度上避开这些弊端。因而未来一个重要的研究方向是将传统方法和深度学习的方法相结合,取二者的优势而避免二者的弊端,这将会更大地提升分布式人工智能的可应用性。近来获得最多关注的是来自Google的科学家利用深度学习模型学习求解混合整数规划,其利用离线数据训练的深度模型来选择分支定界方法中分支的变量,这在经典方法中是通过复杂的计算来决定的,这样可以减少算法的运行时间[60]。虽然分支方法是由深度模型决定的,但在每一次的求解中,该算法利用的依然是传统方法,这可以保证解的最优性。这种将传统方法和深度学习结合的方法取得了两方面的平衡,相信该领域在未来能够取得更快速的进展。