2.4.4 人工动物——ANIMAT

ANIMAT(或人工动物)是灵感来自动物行为和运动学的机器人。在Toda之后,其他许多人(Braitenberg、Holland、Brooker及Wilson[356,357])也提出了相似的人工动物模型,“ANIMAT”这一术语是Wilson在20世纪80年代中期创造出来的。他的ANIMAT是Walter的海龟的升级版,因为它不仅可以与环境交互,而且还可以从经验中学习 Wilson将Walter的海龟视为“半人工动物”,因为它们缺少学习能力。。行为主义和条件反射构成了Wilson模型的基本原则。具体包括规则适应性、遗传进化、涌现和联想等范式。Wilson提出了定义ANIMAT的四个原则:

1.人工动物处于感觉信号的海洋里,但在任何特定情况下,只有一些信号(对运动行动)是重要的,而其余的是多余的。

2.人工动物有行动的能力,而这实际上会倾向于改变这些信号。

3.某些信号和/或某些信号的缺失对人工动物来说具有特殊的地位,如缺乏食物会触发生存本能,看到捕食者、遇到危及生命的地形等,会对人工动物的生存造成问题,并取代所有其他行为。

4.人工动物在外部行动,并且也会通过内部的操作,以最佳地优化特殊信号的出现。

前两个原则是关于感觉运动和具身化的概念,第三个原则将生存能力视为最基本的行为,第四个原则将条件反射和规则适应性结合了起来。

有人提议,将感觉信号与理想的行动结合起来的最合适的规则,必须由ANIMAT作为一种偶然的练习来“发现”,否则不理想的规则应该被忽略。模仿动物可以允许行为在不受外界影响的情况下在体外开始[349]。因此,在相关的背景下,它允许在一个范围内来精确、灵活和有效地设计这些行为,这在真实动物的研究中可能永远不会被观察到,我们将在后面的章节中举例说明。ANIMAT的研究对于基于行为的范式发展和塑造人工生命(ALIFE)学科有一定帮助。

如图2.10所示是《圣经·创世记》故事的诗意改编,在这里,Beavers思考了ANIMAT发展的各种原则,如学习、涌现、形成具有智力成长性的复杂生物等,为人工进化和成长提供了依据。达尔文的自然选择会受到自然灾害的影响(如诺亚洪水的传说),未来反乌托邦机器人启示录在这里也是为了保证质量,这些也可以作为故障安全技术和众所周知的“切断开关”。

ANIMAT在探索自然世界的过程中发挥了重要作用,利用来自大自然的设计,与已知的数学模型和技术协同工作。当然,设计ANIMAT的途径并不是单一的,研究者已经用了各种各样的方法来设计人工生物。如图2.11所示的臂式机器人控制器是通过观察灵长类动物从一棵树摆荡到另一棵树而设计出来的。Nakanishi等[250]将这种运动作为修正的摆振建模,并用神经网络添加了机器学习方面。与之形成鲜明对比的是gastrobot[353]以及之后的其成熟版本ECOBOT系列机器人,它们是基于人类的消化过程和胃肠道系统设计的,目的是利用微生物燃料电池(MFC)实现能量自主。

图2.10 孪生地球的创世记。Beavers对《创世记》的戏仿,这里ANI-MAT由“神一般的运营和开发团队”开发出来,并编码了进化版AI,有从简单的到复杂的类型(如机器人)。随着时间的推移,它们形成了自由意志和伦理价值观。如果事情发展出现偏差,点缀着如诺亚洪水和未来机器人启示录的达尔文式自然选择就是用来使用的工具。Antony Beavers,University of Evansville,授权使用

图2.11 Brachiatron,基于灵长类动物臂力摆荡的机器人。Nakanishi等通过修正摆振而设计了这个运动。右图来自wikipedia.org,CC-by-SA 3.0许可,左图来自NASA JPL Laboratory,www-robotics.jpl.nasa.gov

研究总是试图把更新的想法从大自然引入人工智能,如将在后面章节讨论的机会主义[11]和内心世界[149]。最有趣和最复杂的ANIMAT研究之一涉及基于大脑神经形态的机器人,是基于动物的大脑功能建模的。新千年的ANIMAT研究集中于学习中的神经网络应用,并模仿人类的神经系统和神经过程。CPG和基于大脑的机器人是ANIMAT研究和仿生设计中比较新的流行词汇。

以动物为原型的机器人开发不仅有助于记录已知的自然行为,而且有助于将机器人的设计、行为和过程作为一个单一系统的融合来理解。研究者已经用各种方式应用了ANIMAT范式,我们在后面的段落中会配合案例研究讨论。

1)ANIMAT中的行为建模:ANIMAT中的行为建模可以用于理解昆虫和动物的运动的工程学和生物学机制。

(a)人工昆虫项目。Beer、Lorenz、Baerends和Arkin分别独立完成了将动物行为开发为由控制回路连接的交互模块。如图2.12所示,在Beer的人工蟑螂模型中,进食被建模为两种行为:食欲和满足。前一种行为是识别食物的努力,后一种行为是摄取食物的尝试。能量水平决定人工蟑螂的觉醒与饱足程度,当它处于饱足的状态时就不会再试图获取食物。运动没有作为单独的行为而明确地说明,它通过“边界跟随”和“漫游”在原地发生。Beer注意到进食(食欲和满足)明显比边界跟随优先级更高,然而如果在昆虫觅食的路上有障碍物,那么这个顺序就会反过来。然后人工蟑螂会跟随着障碍物的边缘过去,尝试获取食物。因此,这两种行为之间的顺序是可变的,并取决于环境。Baerends将这种方法命名为“行为的功能性解释”。Beer的蟑螂和Baerends的掘土蜂和银鸥显示,动物行为可以被表示为一系列同时起作用的原始模块,根据所遇到的情境,存在层级顺序和/或抑制或者模块抑制。Arkin等人设计了类似的螳螂行为解构模型并应用在了Miguel(一个Hermes-Ⅱ机器人)上。

(b)GRILLO III,跳跃机器人。浙江大学(中国杭州)的李霏等人和CRIM Lab(Polo Sant'Anna Valdera,意大利)的合作研究人员[205],从袋鼠、兔子、青蛙、蟋蟀、叶蝉和跳蚤身上获得灵感,构建了一个50毫米×25毫米×20毫米的跳跃机器人——GRILLOⅢ,如图2.13所示。设计考虑的是小体积、轻重量、较小的接触面和高能效,以驱动跳跃。它们遵循半经验关系式,这个关系式适用于毫米到厘米大小的昆虫。

图2.12 蟑螂的行为解构。人工蟑螂所用的传感器是触角传感器和口腔传感器,用于从环境中提取信息并与之交互。人工蟑螂能进食、移动、漫游和边界跟随。带黑圈的线表示行为之间的抑制。改编自Beer[33]

这里,Fmax是昆虫肌肉能施加的最大力,取决于接触面,W是昆虫的重量,l是昆虫的特征长度。较小的特征长度使得ANIMAT的关节受力较小,确保更多的稳定性并保证通过跳跃更好地完成移动。这里,对各种昆虫和动物的生态位都要加以利用,以对跳跃行为进行建模。GRILLOⅢ重22克,一次可以向前跳越200毫米。研究人员总结出,有了这样一个模型,它确实补充了昆虫如何选择运动模式以及进化以改善自身健康的知识。

图2.13 跳跃机器人——GRILLOⅢ,从袋鼠、兔子、青蛙、蟋蟀、叶蝉和跳蚤身上获得灵感而开发出来。图片来自Elsevier[205],授权许可

(c)迪士尼的步态机器人。迪士尼研究实验室的单足跳[57,206]设计如图2.14所示。这个单足步态机器人是独一无二的,因为它完全依靠锂电池运行。步态机器人通常是用液压设计的,但是这个机器人使用了一个并行线性弹性驱动器(Linear Elastic Actuator in Parallel,LEAP)装置,如图2.14所示。LEAP有4个组件:编码器、温度传感器、带双压缩弹簧的并联音圈驱动器和两个能驱动做出跳跃动作的伺服电机。这款机器人仍处于研发阶段,在翻倒之前,它可以跳约7秒或差不多19下,缺乏美感,顶部还有一堆电线。后续的版本将希望使用Odroid、Raspberry Pi等使其拥有更强的机上处理能力,让机器人可以保持平衡更长时间。步态机器人的跳跃动作与《小熊维尼》动画系列中跳跳虎的动作非常相似,尽管迪士尼尚未对此进行官方确认。

图2.14 迪士尼的单足跳机器人,仍然处于研发阶段,重2.3千克,高30.5厘米,在翻倒之前,它可以保持平衡约7秒或跳差不多19次。迪士尼粉丝们称这个单足跳机器人让人想起了小熊维尼最好的朋友跳跳虎,尽管迪士尼还没有发表任何官方声明

(d)两足和四足行走的机器人:中枢模式发生器(CPG)是一种在中枢神经系统之上建模的振荡神经元电路,它产生并控制与已知的动物/人类运动模式相似的节律性运动过程。在自然界中,这些过程是在有机体内部进行的,没有任何来自四肢、其他肌肉或任何其他运动控制的感觉输入,而且被认为是负责咀嚼、呼吸、消化和运动的。运动的这种节奏性过程已经在猫、狗和兔子身上得到证实,而且也被认为存在于人类的运动中。CPG可以说类似于钟摆,以恒定的频率产生正弦信号。模式发生器对于模拟涉及两个或两个以上的运动过程的已知的生物运动功能是有用的,这样每个过程就会以串行顺序依次跟随。因此,为了设计一个动态问题的CPG解决方案,研究人员设计了一系列以串行顺序工作的基元来实现一个生物过程(如行走或呼吸)。

CPG曾被用于设计步行机器人以作为手臂机器人的扩展,在逆向运动学原理之上建模。这被发现是难处理的和资源密集型的技术问题,并且通常是一个缓慢的过程,因为机载微处理器需要通过计算类人机器人的每一个手臂/腿的延伸来计算它的下一个位置,其运动与人类运动完全不同。如果从行为的角度解决同样的问题,将“行走”考虑为一种来自“前进”和“平衡”的原始运动行为的自然发生行为,而不是明确地编写一串代码,这有助于显著提高性能。应用CPG的仿生设计对于双足和四足移动是一个很好的选择,也让设计变得简单。生物过程让数学建模落在了空处,但是可以从原始行为来认真地设计。

如图2.15所示,Matos和Santos[222]通过让“平衡运动”“屈曲运动”和“罗盘运动”这三个运动基元同时工作,设计了DARWIN机器人的行走。

CPG源安装在两足机器人靠近头部的位置,为移动产生周期性运动动作。来自放置在四肢上的传感器的反馈,通过修改CPG生成的模式以帮助适应环境。

2)ANIMAT作为小白鼠:ANIMAT为探索动物行为提供了一个现成的平台,有助于推算在之后阶段可能会用于人类的模型,也有助于理解动物心理学和运动学。在演示、教学和研究方面,与豚鼠和兔子相比,ANIMAT是一个更便宜、更高效、更合乎道德的选择。

图2.15 两足运动是CPG的一种新型应用。Matos和Santos[222]使用运动基元——a)平衡运动;b)屈曲运动;c)罗盘运动。Matos和Santos,已经能够使用DARWIN机器人展示行走了。图片来自Elsevier,授权使用

(a)从啮齿类动物到机器人,WR-3机器人和iRAT:以下两个例子都是直接来自老鼠的灵感,帮助构建了老鼠的心理学和运动学模型,从而有助于开发用于药物测试的实验测试台。东京早稻田大学的Ishii等人在已经制作出了类鼠机器人,首先是WM-6[161],之后是更精良的WR-3[151,162],如图2.16所示。基于老鼠建模,用来诱发真实老鼠的压力与抑郁,从而创建可以用于新药测试的心理状况实例。为了模仿老鼠的动态学和生物工程学,该机器人有14个活动自由度,其中12个用于模仿老鼠行为,另外2个活动轮装备在其臀部。这个研究试图探讨压力的心理刺激和导致应激易感性的精神障碍对老鼠体内平衡的影响。WR-3是为攻击和追逐行为而开发的,作为一个实验,它被放入3周大的老鼠群样本中,并记录下老鼠的行为模式和生理上的刺激反应。老鼠、豚鼠、兔子和仓鼠常用于实验室试验,这些试验的结果可推及人类,让进一步的人体试验可以在类似条件下进行。为了诱发压力和抑郁,老鼠的嗅觉能力被切断或让其被迫经历极端的身体不适,如长时间的游泳,其他的替代方法还有基因改造和环境压力,然而,这些方法都不能重现类人的抑郁。利用WR-3机器人进行的实验中,则实时重现了人类经常发生的压力、耻辱感和抑郁的发展过程。Ishii等人在两组12只老鼠上进行了实验。第一组老鼠持续受到机器鼠的攻击行为骚扰,而第二组老鼠则是只要移动就会受到机器鼠的攻击。对该研究进行量化的一般经验法则是,抑郁的老鼠会表现出行动迟缓。而该研究发现,在前几周有被骚扰史的老鼠受到间歇性攻击时,会产生最高程度的抑郁。运用这些方法联系上人类的情况,尝试找到脓毒症、烧伤和创伤的治疗方法。如此调整临床试验也有效地降低了此类试验的成本。此研究的进一步目标是把此类试验扩展到精神障碍领域(如精神分裂症和焦虑症)。WR-3是早稻田大学“Mental Model Robot”小组在过去17年里对老鼠与机器人交互的研究的延续。

图2.16 WR-3机器人,灵感来自老鼠,Ishii与合作研究人员在早稻田大学做的早期研究。Taylor & Francis Ltd(www.tandfonline.com)授权转载[162]

类似的一个项目是iRat,名称取自Intelligent Rat ANIMAT Technology[28]的首字母。如图2.17所示,它是作为研究老鼠对人工老鼠的反应的一个工具在昆士兰大学被开发出来的。研究发现这些老鼠会小心翼翼地接近它们的机器人伙伴,并与之互动。研究人员提出研究iRAT与真实老鼠之间的竞争与合作行为。iRAT已经配合RatSLAM一起使用,RatSLAM是来自生物灵感的一个SLAM系统,架构在控制大鼠大脑导航的神经过程的认知机制上。RatSLAM的优点是可以很好地处理低分辨率和低强度的剖面可视化数据。

图2.17 iRAT(Intelligent Rat ANIMAT Technology[28])是一个人工老鼠,被用于操纵老鼠行为,作为机器-动物交互,也用于实施RatSLAM。Springer授权转载

人们对基于大脑的模型和仿生认知机器人[56]的热情越来越高。成人大脑重1300克到1400克,有约1011个神经元,它的复杂性使得任何试图复制它的尝试都只能望而却步。测量动物大脑信息流和时序目前也还没有可能,这增加了任何直接尝试基于大脑的工作方式设计机器人的难度。然而,利用间接手段,像WR-3和iRAT/RatSLAM这样的项目已经尝试将啮齿动物的行为与大脑功能直接联系起来。OpenWorm项目[81,103]已经把这个问题交给了公民机器人专家,这是一种新的尝试,旨在将大脑神经连接模型的众包、设计和编码集中起来。这样的项目为不久的将来提供了机会,因为融入了现实世界,感官刺激是动物所经历的,因此在神经网络中研究信息流成为可能。基于大脑的机器人中的智能体设计可以通过三种方式来辨别[189]

(1)根据这个研究领域的定义,认知机器人的基于大脑的模型与生物认知一起发挥作用,这作为测试大脑功能(如操作性条件反射、恐惧条件反射和技能习得)理论的一种手段,帮助我们更好地理解适应行为、学习和记忆,如我们在WR-3项目中所看到的。

(2)第二种类型是使用已知的神经地图来设计机器人,让它完成更多与人工智能相关的工作,如地图制作、定位和导航。Damper和其合作研究者为Autonomous Robot Based on Inspirations from Biology(ARBIB)[82,83](以著名的控制论和神经学家Michael Arbib的名字命名)项目设计了一个人工生物,这个人工生物能够应用使用了中枢模式发生器(CPG)的人工神经系统学习并适应环境。ARBIB是在经典条件反射之上建模,并证明了随着经验的积累,行为会有所改善。其他的例子还有来自iRAT的RatSLAM算法,利用老鼠的连接体在SLAM算法上进行改进。类似地还有OpenWorm项目[81,103,216],开始于2011年,模拟线虫(秀丽隐杆线虫)由302个神经元组成的神经网络,形成6393个突触连接体。这帮助开发了需要95个肌肉细胞的运动模型。这个代码被下载到一个有两个轮子的小乐高机器人上,用来演示简单的避障过程,机器虫的鼻子神经元被机器人上的声呐传感器取代。可以看出,乐高机器人在某种程度上复制了线虫的行为:如果机器人距离障碍物不到20厘米,声呐的刺激会让机器人停止下来。一旦停止,从触觉传感器传回的反馈会帮助机器人决定前进或者后退。在其他实验中,也可以看到在声音强度高于一个特定阈值时,这个机器人就会被“引诱”着朝着声源移动。值得注意的是,这些简单的行为都是源于机器虫的连接体,没有其他编码或任何行为的基元创建。因此将Open-Worm连接体模型上升到人类大脑,在未来有着光明的前景。

(3)第三种类型是试图复制特定的感知过程,特别是大脑的视觉或体感过程,来设计机器人。例如,为了方便基于大脑的机器人Darwin IX(如图2.18所示)的体感感知,在它身上装配了一组由聚酰胺条组成的“胡须”阵列,这些“胡须”排列成行或列,在弯曲时发出信号[225]。按列排列的“胡须”模拟了墙壁跟随和躲避行为中的人工神经系统,与猫、刺猬等动物的类似能力相似。

图2.18 带胡须的DARWIN IX。达尔文系列机器人生产于2005—2007年,被作为基于大脑的机器人技术的试验台。在这个实验里,Darwin IX最初是希望实现使用它的“胡须”作为新型触摸传感器完成避障和墙壁跟随——就像在猫、刺猬等动物身上看到的那样。还希望它在遇到高反射时能停止并返回,反射是通过它向下指向的红外传感器检测到的,研究人员将这种行为称为“足底电击”。这些由高反射材料制成的“足底电击”装置被放置在如图所示位置,并且机器人会在本地环境中进行训练。之后,当“足部电击”被移走后,机器人仍然会根据条件反射做出反应,避开这些区域。该机器人的模拟神经系统由17个神经区域组成,含1101个神经单元和大约8400个突触连接。图片来自Krichmar[189],Elsevier许可使用

拟人模型和基于大脑的机器人似乎殊途同归于计算神经科学,而计算神经科学可以说是神经生物学建模(目的是重建动物神经网络)和通过监督和/或非监督学习增强的并行分布式过程的折中。然而,缺点很多:①大脑-身体平衡缺乏关注,因为研究要么过于关注大脑功能和神经设计,要么则基于较低层次的行为开发了智能体,又预期会出现脑的高级功能。②还没有显示出高度并发性的认知机器人,拥有最先进视觉系统的认知机器人则没有足够好的躯体感觉系统或嗅觉感知系统,感觉系统之间也没有无缝的集成。③ANIMAT模型不允许任何建模形态计算的尝试。在动物中,身体系统在不同的感觉节点持续进行计算,并通过中枢神经系统传输到大脑。这还没有被复制到人工领域。④最后,ANIMAT模型没有考虑机器人的思维能力,而相反,认知机器人则依赖于神经地图和大脑功能,但也没有考虑主体的独特经验能力,因此不足以展现意识。这个主题会在第9章进一步讨论。

(b)蛇形机器人:蛇形机器人由许多相互连接的模块化关节组成,并通过CPG设计,如图2.19所示。这种蝾螈的ANIMAT模型已经在瑞士洛桑的EPFL实验室被开发出来,并希望能够为脊髓损伤患者提供一个运动学模型,帮助其电刺激治疗。

图2.19 蛇形机器人。由许多相互连接的CPG模块组成。图片来自wikipedia.org

3)有组织的团体和群体中的社群行为研究:ANIMAT为我们提供了理解和探索动物-机器人社群中如合作、内聚、适应这样的社群行为的机会,这被证明是群体机器人的一个福音。在下面的两个场景中,第一个场景里面机器人为一群鸭子提供领导力;而在第二种中,机器人蟑螂在一个蟑螂群体中找到了社会认同感,反过来在修正群体行为方面发挥作用。值得注意的是,与WR-3不同,这两个项目并没有努力追求视觉效果良好的机器人模型,只是模仿其中一个目标物种,即鸭子和蟑螂。

(a)Robotic Sheepdog项目:Robotic Sheepdog项目[335]是Cam-eron和他在牛津大学的合作研究者的创意,这是对动物交互机器人的首次研究。该项目的目标是构建和编程一个自主机器人以放牧一群鸭子。机器人会展示领导力,把一群鸭子聚集在一起,并领着它们去往一个已知的安全区域。这个项目探索了动物、昆虫和鸟类因为收集食物、躲避捕食者、社会凝聚力、以相同或相似的地理位置作为目标点、外貌、筑巢等而形成群体的一般趋向性。整个系统如图2.20所示,由一个定制的探测车、两个工作站和一个头顶摄像头组成。探测车的速度为1~2米每秒,大约是鸭子的两倍,它需要将鸭子群作为一个整体而不是单个分开对待,同时也要避开障碍物。这个项目显示了使用机器人完成行为仿真可以作为一个合适的设计工具,这种方法可以很容易地用于动物-机器人交互。

图2.20 Robotic Sheepdog项目。来自Vaughan等[335],Elsevier许可使用

(b)INSBOT:蟑螂群体中的移动机器人。因为ANIMAT的灵感来自动物,它们应该能够被动物社群所接受。由于Robotic Sheepdog项目是构建在鸭子的条件反应基础上的,而且机器人能够有效地驱赶鸭群,所以类似社群中的其他行为应该也是貌似合理的。Halloy等人[139,296]在一个跨越三个国家的4个实验室的合作中,通过在一个蟑螂社群中引入一些机器人对其进行了探索。如图2.21所示的INSBOT,被从雄性蟑螂身上采集的信息素处理过的滤纸包裹着,然后引入蟑螂群体。INSBOT上的信息素诱发了友善的接受行为,这在蟑螂的生理机能中是根深蒂固的。Halloy等人准备了两个居所,一个是黑暗的,另一个是明亮的。众所周知,蟑螂喜欢黑暗的条件。但是INSBOT没有这样的偏好。蟑螂群体在73%的时间中偏好比较黑暗的居所,但是在引入了INSBOT后,收集到的数据发生了根本性的变化,蟑螂-INSBOT社群只有在39%的时间中偏好黑暗居所——差异达到34%。这不仅表明蟑螂已经接受了INSBOT进入它们的社群,也证实了群体行为的一致性,INSBOT被当作蟑螂一样对待。动物机器人集体动态和凝聚力已经引起了生态学家[87]和群机器人研究者的兴趣。

图2.21 蟑螂群体中的INSBOT。INSBOT被从雄性蟑螂身上采集的信息素处理过的滤纸包裹着,制作得并不像真的蟑螂,因为蟑螂的所有社群交互都是基于信息素的而非基于视觉的。图片来自Elsevier[296],授权许可

4)行为模型的既有实现:可以使用ANIMAT方法来实验验证决定动物社群交互的最优性、食饵-捕食动态、信号发送、博弈论方面的控制模型。

为了支持基于行为的机器人的新架构范式,Brooks在麻省理工学院利用行为分层设计了他的机器人生物,在行为分层中每种行为都被设计为一个有限状态模型。运动是这些生物的基础,避障是最原始的行为,随后的漫游是第2层,目标导向的运动是第3层。每个行为层都是一个完整的循环,从传感器读数到驱动,这些层之间的相互作用被限制为零。但是,更高的层可以支持、规避、中断或覆盖较低的层。Brooks称他的人工生物为Mobots(Mobile Robots,移动机器人),他和他的团队是根据以下原则进行设计的:

·人工生物必须相应地处理动态环境的变化。

·人工生物应该足够健壮以承受其环境。

·人工生物应该能够在多个目标之间完成协调。

·人工生物应该表现出它存在的目的,并采取行动以改变其世界。

Brooks的机器人生物是新的人工智能机器人的里程碑,这将在接下来的几节和第3章中进行讨论。这个新范式的突出特点是缺乏计划模块,甚至没有环境建模和源自大自然的直接灵感。这与传统已知的人工智能技术(如Nilsson为Shakey的移动而运用的基于网格的方法)完全不同。Brooks和他的合作研究者的全部研究包含许多机器人:Toto、Allen、Herbert、Seymour、Tito、Genghis、Labnav、Squirt以及其他。如图2.22所示,Herbert是为办公室工作空间而设计的。它的主要工作是四处漫游,用它的长手臂去搜集那些无法轻松拿到的空饮料罐。Genghis被设计成一个六条腿的机器人,它通过原始和简单行为的快速同步方法来行走。Squirt是微型机器人制造的早期尝试,Brooks幽默地称它为“世界上最大的一立方英寸机器人”。

图2.22 Herbert。它的顶部有一个机械臂,其目标是在一个杂乱的环境中寻找百事可乐罐并收集它们。图片来自wikipedia.org,CC0 1.0通用公共领域专用许可

Cog(如图2.23所示)是一个根据感觉运动原理设计的类人机器人。然而,这个趋势并没有成为真正的动力,所有现代最先进的类人机器人(如ASIMO、PR2和NAO)都有感觉运动和具身主义的信息。

图2.23 Cog是一个根据感觉运动原理[92]设计的类人半身机器人。图片来自wikipedia.org,CC0 1.0通用公共领域专用许可

完全相反的是,洛斯阿拉莫斯实验室的Hasslacher和Tilden开发了一个完全不一样的模型[145],在这个模型里是生存决定行为和移动。他们的人工生物叫作BIOMORPHS(BIOlogical MORPHology,生物形态学),依照在一个之前未知和明显不友好的地形中生存的出发点而设计。这些机器需要遵循以下三个规则:

·机器必须保障其存在。

·机器必须获取比其消耗更多的能量。

·机器必须有(定向)运动能力。

BIOMORPHS的设计是为了生存,而不是执行一组目标导向的任务。太阳能是这些机器人的燃料,制造它们时使用了BEAM(Biology、Electronics、Aesthetics、Mechanics,生物学、电子学、美学、机械学)技术。BEAM利用微型太阳能电池来模拟生物神经元,并产生微电机和LED所需的极少量电力。步态机器人是BIOMORPHS最流行的类型,Hasslacher和Tilden还设计了两条腿、四条腿、六条腿的变体。BIOMORPHS不仅是最小的主体,而且试图创造生命,这些机器人的控制核心包括一个人工神经系统,一个充当大脑功能的神经层。因此,它有丰富的行为范围,并表现出卓越的学习能力。

5)对生物过程建模:食菌者能够消化真菌并获得能量。这种通过消化有机物质来产生运行动力的能量自主,是Gastrobot和Ecobot系列机器人的设计灵感来源。这些机器人通过在微生物燃料电池(Microbial Fuel Cell,MFC)中消化有机物质来产生能量。自2000年Wilkinson的Gastrobot项目[353]开始,以及较新的项目如Ecobot-Ⅲ和Ecobot-Ⅳ都已经展现了真实的能量自主。

Gastronome——Wilkinson的Gastrobot机器人,可以在现实世界中收集食物,通过咀嚼把食物分解成更小的可消化的块,然后把它摄入人工胃,在胃里通过一个受控的化学反应产生能量,而废物则作为排泄物排出。Gastronome由MFC供能,MFC通过微生物的作用,可以直接将各种食物成分和有机废物的化学能直接转化为电能。Wilkinson为该机器人确定了6个不同的操作:

·觅食,寻找和辨别食物

·收获,收集食物

·咀嚼,咀嚼以把食物分解成更小的块

·摄入,吞咽到人工胃

·消化,提取能量

·排便,排泄废物

它的运动表现为趋光行为。然而,效率相当低,大约只有1.56%,在之后的版本里也没有显著改善,这也阻碍了它在商业领域(如家用机器人、办公机器人等)的应用。这是在人工干预很少或没有干预的情况下实现能源自主的第一步,但它仍然需要使用机载电池,需要从主电源进行初始充电。为了提高其性能和通用性,先进一些的设计应该有一系列传感器,实现视觉和嗅觉感知以进行觅食和收获,实现味觉感知以避免摄入可能对微生物工作有害的食物。

机器人能从本地环境中的自然资源中维持能量需要。能量自主在不久的将来的一些前景是:由落叶或水果供能的水果采摘机器人或土壤检测机器人;由海草和藻类供能的海洋探索机器人模块;以水果、蔬菜和草为燃料的森林探索机器人等。

根据设计范式,这些机器人通过微生物释放的能量供能,机器人的收集机制则为微生物提供食物,这是一种非生物和生物之间独特的相互依存关系,被称为人工共生,共生机器人(SymBot)。

Ecobot系列机器人——Ecobot-Ⅰ(2002年)、Ecobot-Ⅱ(2004年)、Ecobot-Ⅲ(2010年,如图2.24所示)和Ecobot-Ⅳ(进行中)是布里斯托机器人实验室和布里斯托生物能源中心的Ieropoulos和他的合作者们为实现能量自主而制作的一系列机器人。Ecobots没有机载动力源(如液态燃料或电池),它们移动前也不需要从外部电源充电。相反,它们近乎能量自主,通过收集废料从环境中提取能量。Ecobot-Ⅰ重960克,以糖为燃料,通过以大肠杆菌为阳极、铁素体为阴极的氧化作用来维持。Ecobot-Ⅱ更为先进,它使用污泥微生物,能够通过蝇类和腐烂的水果合成能量。Ecobot-Ⅱ可以说是第一个实现能量自主,也符合人工共生的机器人。Ecobot-Ⅳ是这个系列中最新的也是正在研制中的机器人,旨在研究微型化设计的效果。

图2.24 布里斯托机器人实验室研发的ECOBOT III。能量自主,能够消化有机物质来获得运行能量。图片来自wikipedia.org,SA 3.0授权许可

各种各样的特殊ANIMAT可以通过它们的概念设计来辨别,在实现、软件和平台发生变化的情况下,机器人仍然会保持它们的抽象概念。例如,对于ARBIB,机器人在各种硬件实现上保留了它的CPG模型和神经模拟器(如图2.25所示Zilog上的ARM或Khepera avatar)。其他这类例子如:Stiquito,不管硬件如何变化,其形状记忆特征维持不变;以独特的六足设计为特征的R-Hex,已经有了很多实现;以及拥有圆形底座、内置笔记本电脑和时髦的运动传感器(如Microsoft Kinect或ASUS Xtion)的Turtlebot,已经有了三个正式版本,并为一些更新的机器人设计提供了灵感。

图2.25 ARBIB(Autonomous Robot Based on Inspirations from Biology,基于生物灵感的自主机器人)。这里所示的为Zilog Z180 avatar。图片出自Dampier等[83],Elsevier授权使用

根据定义,ANIMAT研究是人工智能与动物智能的交叉领域,如图2.26所示,它受感觉运动交互的支配,依赖于较低级别的行为反应。友好的拟人化特征往往有助于机器人融入人类社会,如图2.27所示,但这对于类人的认知过程是不够的。第3章将简要讨论简单的感觉运动设计如何也能表现与人类相似的情感和价值观。

图2.26 智能的三个领域。(1)动物和人类智能的融合可能是最常见的,并在驯养动物、利用动物力量(如骑马等)等方面发挥作用。(2)ANIMAT研究是人工智能与动物智能的交叉领域。(3)人类智能与人工智能在聊天机器人、类人机器人和伦理责任(将在第8章中讨论)中协同作用。(4)所有这三个领域的交叉则是神经形态和基于大脑的机器人技术的目标。本表改编自Yampolskiy[370]

图2.27 圣诞节礼物(Toby,2/4)。爸爸把Toby带到Walker家。来自作者的Toby系列卡通(2/4),SA 4.0授权许可

[1] Wilson将Walter的海龟视为“半人工动物”,因为它们缺少学习能力。