第1章
人工智能时代的产品思考

1.1 人工智能产品

1956年,科学家在达特茅斯会议(Dartmouth Conferences)上提出了人工智能(Artificial Intelligence,AI)这个概念,在此之后的几十年里,人工智能技术在实验室中被慢慢孵化,它被认为是人类命运转折的关键技术或摧毁人类的罪魁祸首。如今,人工智能技术已经渗透到人们的生活中,各种基于人工智能技术的产品层出不穷,在不断改变着我们的生活。

人工智能技术是研究用于模仿、延伸和扩展人类智能的理论、方法、技术及应用系统的一门新的技术。人工智能技术从本质上来看是模仿人类智能的技术,人工智能技术对人类智能的模仿如图1-1所示。

图1-1 人工智能技术对人类智能的模仿

人工智能产品主要是指利用人工智能技术开发的一系列产品,其核心是算法模型。从产品价值的角度来讲,人工智能产品提高了信息产生的效率,互联网产品提高了信息传递的效率。随着信息传递效率的提高,人类社会进入了万物互联、协同发展的时代。未来随着信息产生效率的提高,人类社会将进入万物智能的新时代。

人工智能技术在产品中的应用以数据为基础,由于数据中包含了大量业务信息,所以人们利用数据进行“训练”以得到算法模型,算法模型是人工智能产品的核心。人们通过大量数据来确定一种运算模式,这个过程称为“训练”,所得到的运算模式就是算法模型。在算法模型确定后,将新的数据输入算法模型从而得到相应的结论。所以在人工智能产品的构建过程中,数据是十分重要的,它直接影响算法模型的质量。

如今有很多与人工智能技术相关的研究领域和技术,如图像处理、自然语言处理(Natural Language Processing,NLP),以及当前较为先进的工业语言处理(Industrial Language Processing,ILP)等。

工业语言处理是一类基于符号识别、机器翻译、逻辑推断等人工智能技术,用来处理行业通用性标识语言的技术。这项技术能够处理行业通用性标识语言,如电路图、建筑构图、化学结构式等。机器能够自动识别、分析工业语言,并根据工程师的相应需求实现多种功能。这项技术的产生代表了人工智能技术与行业的深度融合,也符合当前产业互联网发展的特点。

图像处理是人工智能技术应用的热点方向。基于卷积神经网络(Convolutional Neural Networks,CNN)对图像进行特征提取,机器可以自动完成图像识别、图片分类、图像目标检测等任务。人脸识别是人工智能技术在图像处理领域的重要应用,通过对人面部特征进行提取和对比,达到人脸识别的效果。利用人工智能技术对人面部特征进行提取如图1-2所示。

图1-2 利用人工智能技术对人面部特征进行提取

自然语言处理是人工智能技术应用的又一大方向。自然语言处理是通过人工智能技术对人类语言进行分析、挖掘的一系列过程,其中包括语义理解、智能问答、语料资源建设、内容分析等几大模块。进行自然语言处理首先需要用已经标注好的语料作为数据进行训练,通过马尔可夫链(Markov Chain,MC)、长短时记忆(Long Short-Term Memory,LSTM)神经网络等一系列人工智能技术对数据进行训练从而获得算法模型。自然语言处理是一个很大的方向,拥有诸多应用场景。自然语言处理的一些应用场景如图1-3所示。

图1-3 自然语言处理的一些应用场景

随着人工智能技术在各个行业中的深入应用,教育、金融、医药、交通、安防等诸多领域都有人工智能产品落地。图1-4概括了人工智能产品在各个领域的发展方向。例如,在教育领域,有个性化教学类的人工智能产品,可以根据不同孩子的学习情况因材施教;在金融领域,人工智能技术可以给股民朋友提供新的投资策略;在医药领域,人工智能技术应用于智能医学影像分析、药物构效关系预测、电子病历分析等。未来人工智能技术会给越来越多的行业带来更大的变革。

图1-4 人工智能产品在各个领域的发展方向

互联网的高速发展使人类社会进入了大数据时代,大数据对人工智能的发展起到了积极的推动作用。在硬件方面,图形处理器(Graphics Processing Unit,GPU)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)等的发展使数据处理能力大幅提高,云平台、摄像采集终端、各类数据传感器等基础设施的发展则为数据的采集、储存、开发提供了良好的载体。在软件方面,各类人工智能产品框架的发展,以及各种算法、网络模型的优化迭代等为人工智能技术的应用创造了有利条件。基于硬件与软件的高速发展,人工智能技术将更好地为大众生活服务。以下4个例子集中体现了人工智能技术正在改善人们的生活。

(1)人工智能+自动驾驶。

(2)人工智能+安防。

(3)人工智能+医药。

(4)人工智能+工业。

1. 人工智能+自动驾驶

百度无人车Apollo在2018年中国中央电视台春节联欢晚会上亮相,它们组成车队出现在港珠澳大桥上,完成了很多高难度动作。此次亮相的无人车有多种车型,包括无人驾驶巴士、无人驾驶扫路机及无人驾驶物流车等。这些产品的应用场景包括家用出行、自动泊车、园区转运、城市物流运输等。

如果自动驾驶技术得到大规模应用,那么我们的出行方式将会发生极大的变化。早在2014年,国际汽车工程师学会(SAE International)就发布了自动驾驶技术的六级分类体系,具体级别划分和描述如表1-1所示。

自动驾驶是一系列人工智能技术的综合体现,包括图像识别、模式识别、定位及信号切换等技术。当前,大部分自动驾驶汽车还停留在LV1或LV2等级,但随着数据的积累、设备组网的落实、通信效率的提高,LV5时代的到来指日可待。

2. 人工智能+安防

安全始终是一个国家和一个城市重点关注的问题,安防状况关系到每个公民的生命财产安全。我国公共摄像头的普及及“天网工程”的实施都极大地推动了智能安防的发展。当前的智能安防技术主要通过识别监控视频中的图像数据,借助图像处理技术从海量图像数据中寻找安全隐患,实现安防行业从“看得清”到“看得懂”的智能升级。智能安防技术还可以用于进一步预测犯罪高危人群在某区域出现的概率,从而为警方制订合理的警力部署方案提供依据。目前,基于人工智能技术的视频监控产品能够自动识别人群非法集会、斗殴等一系列危险场景并及时报警。智能安防系统可以根据摄像头获取的图像自动提取行人与车辆的图像,如图1-5所示。

表1-1 自动驾驶技术分级体系

图1-5 智能安防系统界面

2016年我国国内安防市场规模约为5410亿元,到2019年我国国内安防市场规模达到7412亿元,安防类设备市场规模约为2100亿元。视频监控是安防行业最大的应用场景,占整个安防市场规模的50.63%。安防行业具有巨大的市场空间,传统安防行业也必将向智慧安防行业升级。

3. 人工智能+医药

人工智能技术在医药领域具有巨大的应用潜力。李开复在《人工智能》一书中也多次提到,人工智能技术对人类非常有意义的作用之一就是促进了医药行业的发展。笔者在人工智能医药领域工作多年,深切感受到人工智能技术为医药行业带来的变革。在医疗服务方面,智能医学影像分析系统、智能导诊系统、区域健康管理平台、电子病历分析平台、基因检测平台等都使用了人工智能技术;在药物研究方面,药物警戒系统、计算机辅助药物筛选平台、智能药物分析检测工具、临床科研平台等产品都是人工智能技术在医药领域应用的杰出代表。人工智能辅助病理诊断系统可以通过算法自动对肿瘤细胞进行定位,如图1-6所示。病理诊断是国际上公认的癌症诊断金标准,它是先对活体组织进行取样并制作成组织切片,然后病理医生根据个人经验进行观察的诊断方式。在我国,病理医生极度缺乏,远远无法满足当前的诊断需求。病理医生依靠肉眼对病理图像进行观察并对病理进行诊断的过程非常缓慢,需要具有丰富的临床经验才能做出正确判断。人工智能辅助病理诊断系统通过对癌症组织进行特征提取,能够快速定位病灶区域,极大地提高了病理医生的诊断效率。

图1-6 人工智能辅助病理诊断

众所周知,药物研发成本高且周期长,具有极高的风险。一个新药从最初的苗头化合物(Hit Compound)筛选到上市需要10年左右的时间。为加快药物研发速度,人们通过人工智能技术构建了许多产品,以在药物研发不同时期加速研发进程。例如,通过强化学习算法加速分子与蛋白的对接速度,通过蒙特卡罗树搜索(Monte Carlo Tree Search,MCTS)算法对化合物进行逆合成分析,通过迁移学习算法进行临床试验设计等。人工智能技术在药物研发不同阶段的应用场景如图1-7所示。

图1-7 人工智能技术在药物研发不同阶段的应用场景

目前在医疗诊断领域,人工智能产品虽然不能完全替代医生,但是可以帮助医生提高诊疗效率和降低失误率,还可以在一定程度上解决偏远地区医生不足的问题。医疗领域的算法模型主要依靠对专业医疗数据进行训练得到,当前的首要问题是缺乏足够的真实准确的医疗数据来进行训练。目前的医疗数据本身也存在种种问题,包括存储混乱、各地方数据标准不统一等。为了解决这些问题,政府正在积极建设医疗数据中心,推进医疗数据治理工作,建立医疗数据标准,促进人工智能医疗产品的发展。

医疗数据中心在我国已经初见规模,但医疗数据应用方面的相关法律还有待健全,特别是医疗数据商业应用方面的法律。只有通过商业价值的驱动,医疗数据才能真正发挥其巨大的作用。如何在确保个人隐私不被泄露的前提下安全、高效地使用医疗数据至今也没有确定的标准。这些因素也阻碍了人工智能技术在医疗领域的发展。在此方面,笔者认为医疗数据的商业应用可以分为两个阶段。

第一个阶段:经过医疗数据分析得到的结论可以进行商业应用。

首先经过国家授权具有医疗数据分析资质的医院或机构可以对医疗数据展开分析工作。对医疗数据进行分析得出的结论一般属于统计学信息,不存在个人隐私泄露的问题。这部分结论可以进行商业应用。

第二个阶段:不含个人隐私信息的医疗数据可以进行商业应用。

在完成第一个阶段的工作之后,由于具有医疗数据分析资质的医院或机构数量有限,医疗数据的分析远远无法满足市场的需求。我们需要探索医疗数据的脱敏方案,将医疗数据去除一切个人隐私信息后向市场开放。

医药数据作为稀缺资源,要经过合理的脱敏处理才能向市场开放。医药数据的开放必将对医药行业产生巨大影响,也会极大地推动医药产业的发展与商业模式升级。

4. 人工智能+工业

“工业4.0”是指利用物理信息系统(Cyber Physical System, CPS)将生产中的供应信息、制造和销售信息数据化,并辅以人工智能算法进行分析,最后针对个体用户进行个性化产品供应的智能化工业时代。

“工业4.0”是基于物联网的智能化工业时代。物联网的大规模应用使设备间相互连通并产生大量运营数据。在工业的整体系统中,物联网、传感器、数据传输、数据治理等技术的不断发展为工业的智能化转变提供了可靠的感知基础与数据基础。工业人工智能产品可以提高工业流程效率,降低人在工业实施过程中的参与程度,为人们提供智能化的解决方案。“工业4.0”的发展框架如图1-8所示。

近年来,工业人工智能产品的种类呈现爆发式的增多态势。2015年,美国通用电气(General Electric,GE)公司推出Predix云平台。Predix是一个面向工业开发者的云平台,它通过物联网通信,为使用者提供有效的数据,它也支持搭建多种智能分析平台,从而帮助使用者高效、智能地进行平台运营并提高服务效率。当前通用电气、丰田、固特异、宝洁、日产、中船工业等企业,都在利用人工智能技术寻求产业的加速转型。

图1-8 “工业4.0”的发展框架

人工智能技术在各个领域蓬勃发展,为我们的生产、生活带来了便利。与此同时,人工智能技术的使用不当与过分依赖也会造成不可逆转的严重后果。2018年10月,印度尼西亚狮子航空公司一架波音737-MAX 8客机在雅加达起飞13分钟后坠毁在爪哇海;2019年3月,埃塞俄比亚航空公司一架波音737-MAX 8客机坠毁。经调查,两次空难的发生都是由于波音737-MAX 8客机的人工智能辅助自动平衡系统出现问题。当前几乎所有客机都装配了人工智能辅助自动平衡系统,人们对人工智能技术的过度依赖使得他们在危险来临时束手无策。为避免意外的发生,人工智能技术的使用应该有一定的原则和底线。

2018年6月谷歌(Google)公司的CEO桑达尔·皮查伊(Sundar Pichai)向人工智能产品的设计者与技术人员提出了7项原则与4条底线。

7项原则如下。

① 对社会有益。

② 避免制造或加剧社会偏见。

③ 提前测试以保证安全。

④ 由人类承担责任,即人工智能技术将受到适当的人类指导和控制。

⑤ 保证隐私。

⑥ 坚持科学的高标准。

⑦ 从主要用途、技术独特性、规模等方面来权衡。

4条底线如下。

① 对于那些将产生或者导致伤害的整体性技术,要确保其利大于弊,并做好确保安全的相关限制。

② 不会将人工智能技术用于制造武器及其他将会对人类造成伤害的产品。

③ 不会将人工智能技术用于收集或使用用户信息,以进行违反国际公认规范的监视。

④ 不会将人工智能技术用于违反国际法和人权的产品开发。

只有在坚持原则与坚守底线的前提下利用人工智能技术,才能创造出优秀的产品,从而推动产业发展升级。