1.2 人工智能发展史

要想了解人工智能向何处去,首先要知道人工智能从何处来。人工智能从1956年提出到今天,走过了60多年,经历了计算驱动、知识驱动和数据驱动三次浪潮(见图1-4)。

图1-4 人工智能的三次浪潮

1.2.1 计算驱动

1.达特茅斯会议

1956年8月,在美国汉诺斯小镇宁静的达特茅斯(Dartmouth Conference)学院中,约翰·麦卡锡(John McCarthy)、马文·明斯基(Marvin Minsky,人工智能与认知学专家)、克劳德·香农(Claude Shannon,信息论的创始人)、艾伦·纽厄尔(Allen Newell,计算机科学家)、赫伯特·西蒙(Herbert Simon,诺贝尔经济学奖得主)等科学家正聚在一起,讨论着一个主题:用机器来模仿人类学习以及其他方面的智能。

会议足足开了两个月的时间,虽然大家没有达成普遍的共识,但是却为会议讨论的内容起了一个名字:人工智能。因此,1956年也就成为人工智能元年。

2.人工智能计算驱动的基本思想

从这次会议之后,人工智能迎来了它的一个春天,鉴于计算机一直被认为是只能进行数值计算的机器,所以,它稍微做一点智能的事情,人们都惊讶不已。这个时期诞生了世界上第一个聊天程序ELIZA,它是由麻省理工学院的人工智能学院编写的,能够根据设定的规则,根据用户的提问进行模式匹配,然后从预先编写好的答案库中选择合适的回答。这也是第一个尝试通过图灵测试的软件程序,ELIZA曾模拟心理治疗医生和患者交谈,在首次使用的时候就骗过了很多人。

1959年,塞缪尔的跳棋程序(见图1-5)会对所有可能跳法进行搜索,并找到最佳方法。“推理就是搜索”是这个时期主要研究方向之一。

图1-5 塞缪尔的跳棋程序

人工智能发展初期的突破性进展大大提升了人们对人工智能的期望,人们开始尝试更具挑战性的任务,并提出了一些不切实际的研发目标。

1956年,西蒙和纽厄尔预言“十年之内,数字计算机将成为国际象棋世界冠军。”然而10年过去,人工智能的发展远远滞后于当时的预测。

3.计算驱动导致人工智能的发展走入低谷,有哪些表现?

这次寒冬不是偶然的。在人工智能的第一个黄金时代,虽然创造了各种软件程序或硬件机器人,但它们看起来都只是“玩具”,要迈进到实用的工业产品,科学家们确实遇到了一些不可战胜的挑战。让科学家们最头痛的就是虽然很多难题理论上可以解决,看上去只是少量的规则和几个很少的棋子,但带来的计算量却是惊人的增长,实际上根本无法解决。比如运行某个含2的100次方计算的程序,即使用当时运算速度很快的计算机也要计算数万亿年,这是不可想象的。所以,计算驱动导致人工智能的发展走入低谷主要表现为计算能力有限。

1.2.2 知识驱动

20世纪70年代出现的专家系统,模拟人类专家的知识和经验解决特定领域的问题,实现了人工智能从理论研究走向实际应用,从一般推理策略探讨转向运用专门知识的重大突破。专家系统在医疗、化学及地质等领域取得成功,推动人工智能走入应用发展的新高潮。

1.专家系统

专家系统的起源可以追溯到1965年,美国著名计算机学家费根鲍姆(Feigenbaum,见图1-6)带领学生开发了第一个专家系统Dendral,这个系统可以根据化学仪器的读数自动鉴定化学成分。20世纪70年代,费根鲍姆开发了另外一个用于血液病诊断的专家程序MYCIN(霉素),这可能是最早的医疗辅助系统软件。

专家系统其实就是一套计算机软件,它往往聚焦于单个专业领域,模拟人类专家回答问题或提供知识,帮助工作人员做出决策。它一方面需要人类专家整理和录入庞大的知识库(专家规则),另一方面需要计算机科学家编写程序,设定如何根据提问进行推理找到答案,也就是推理引擎。

专家系统把自己限定在一个小的范围,避免了通用人工智能的各种难题,它充分利用现有专家的知识经验,务实地解决人类特定工作领域需要的任务,它不是创造机器生命,而是制造更有用的活字典、好工具。

1984年,微电子与计算机技术公司(MCC)发起了人工智能历史上最大也是最有争议性的项目Cyc,这个项目至今仍然在运作。

Cyc项目的目的是建造一个包含全人类全部知识的专家系统。截至2017年,它已经积累了超过150万个概念数据和超过2000万条常识规则,曾经在各个领域产生超过100个实际应用,它也被认为是当今最强人工智能。

知识驱动点燃了日本政府的热情。1982年,日本国际贸易工业部发起了第五代计算机系统研究计划,投入8.5亿美元,创造具有划时代意义的超级人工智能计算机。这个项目在10年后基本以失败结束,然而,第五代计算机计划极大地推进了日本工业信息化进程,加速了日本工业的快速崛起;另一方面,这也开创了并行计算的先河,至今人们使用的多核处理器和神经网络芯片,都受到了这个计划的启发。

2.知识驱动导致人工智能的发展走入低谷,有哪些表现?

20世纪80年代中至90年代中,遭遇了知识获取和神经网络的局限,人工智能又一次处于低谷,主要表现在以下几个方面。

(1)知识获取瓶颈

随着人工智能的应用规模不断扩大,专家系统存在的应用领域狭窄、缺乏常识性知识、知识获取困难、推理方法单一、缺乏分布式功能、难以与现有数据库兼容等问题逐渐暴露出来。

(2)神经网络的局限

曾经一度被非常看好的神经网络技术,过分依赖于计算力和经验数据量,因此长时期没有取得实质性的进展。

1.2.3 数据驱动

数十年后,物联网、云计算及大数据技术的成熟,使神经网络成为当今人工智能的关键技术。2006年,Hinton出版了《Learning Multiple Layers of Representation》,奠定了神经网络的全新架构,它是人工智能深度学习的核心技术,后人把Hinton称为深度学习之父(见图1-6)。

2007年,在斯坦福任教的华裔科学家李飞飞(见图1-7),发起创建了ImageNet项目。为了向人工智能研究机构提供足够数量可靠的图像资料,ImageNet号召民众上传图像并标注图像内容。ImageNet目前已经包含了1400万张图片数据,超过2万个类别。自2010年开始,ImageNet每年举行大规模视觉识别挑战赛,全球开发者和研究机构都会参与贡献最好的人工智能图像识别算法进行评比。尤其是2012年由多伦多大学在挑战赛上设计的深度卷积神经网络算法,被业内认为是深度学习革命的开始。

华裔科学家吴恩达(Andrew Ng,见图1-8)及其团队在2009年开始研究使用图形处理器(GPU)进行大规模无监督式机器学习工作,尝试让人工智能程序完全自主地识别图形中的内容。2012年,吴恩达取得了惊人的成就,向世人展示了一个超强的神经网络,它能够在自主观看数千万张图片之后,识别那些包含有小猫的图像内容。这是历史上在没有人工干预下,机器自主强化学习的里程碑式事件。

图1-6 Hinton

图1-7 李飞飞

图1-8 吴恩达

2014年,伊恩·古德费罗提出GAN(Generative Adversarial Networks)生成对抗网络算法,这是一种用于无监督学习的人工智能算法,这种算法由生成网络和评估网络构成,以左右互搏的方式提升最终效果,该算法很快被人工智能很多技术领域采用。

2016年和2017年,谷歌发起了两场轰动世界的围棋人机之战,其人工智能程序AlphaGo连续战胜围棋世界冠军韩国的李世石(见图1-9),以及中国的柯洁。

图1-9 AlphaGo战胜李世石