- 基于人工免疫原理的检测系统模型及其应用
- 赵林惠
- 13148字
- 2021-03-12 18:05:46
1.4 人工免疫系统理论与应用研究进展
目前,人工免疫系统已经引起了人们的较大重视,基于免疫系统机理的模型在科学和工程中将得到越来越多的应用。
1.4.1 人工免疫系统的兴起、发展及现状
1.人工免疫系统的兴起
作为生物领域中一门相对年轻的学科,免疫学就是用免疫学的方法预防传染病,其历史可以追溯到16世纪,我国医学家创造性地以人痘预防天花。1796年,英国医生Edward Jenner以牛痘的发明取代了人痘苗,是经典的免疫学开端。19世纪中叶起,微生物学的研究取得了令人瞩目的进展,细菌分离培养的成功为各种人工菌苗的制备创造了条件。1881年,法国免疫学家Pasteur发明了减毒细菌疫苗,奠定了经典免疫疫苗的基础。1896年,德国学者Ehrlich提出了抗体生成的侧链学说(side chain theory),精确地推测了抗原与抗体分泌细胞相互作用的方式,奠定了受体学说的基础,不但对免疫学,而且对整个生命科学都具有重要意义。
20世纪20年代后期是免疫学的免疫化学研究阶段。在该阶段,在抗原、抗体理化性质及抗原抗体反应特异性化学基础的研究方面都取得了重要的进展。1930年,Landsteiner因对半抗原及血型抗原的研究而获得诺贝尔医学奖。与免疫化学的兴起相对应,在免疫学理论方面,Haurowitz等人又提出抗体生成的模板学说并以此取代了侧链学说。1950年,丹麦学者Jerne提出了抗体生成的天然抗体选择学说,直接对模板学说发起了挑战。1957年,Burnet在免疫生物学研究以及遗传学研究的基础上,提出了抗体生成的克隆选择学说——不仅阐明了抗体生成的生物学机制,而且对许多重要的免疫生物学现象,如抗原识别、免疫记忆、自身耐受、自身免疫等一系列问题,都作出了解答,从而奠定了现代免疫学的基础[48]。进入20世纪70年代,抗体独特基因型被发现,Jerne、Richte和Hiernaux等人(1974—1977年)先后提出抗体独特型调节网络学说,认为机体免疫系统是一个建立在识别自身抗原的基础上来识别外来抗原的系统,抗体分子的可变区结构域具有双重特性,它通过抗原结合部位与抗原结合,又借助于独特型决策簇引发免疫应答。这一学说把免疫应答看成免疫细胞和抗体分子相互作用的网络调节的结果,从一个新的角度阐释了免疫耐受、自身免疫和变态反应等免疫现象[49]。随着胸腺免疫功能的发现、淋巴细胞免疫功能的确认以及抗体分子结构域功能的研究进展,免疫学在器官、细胞和分子水平上揭示了机体存在一个十分重要的功能系统——免疫系统。总之,经过上述一系列的发展,免疫学已经成为一门独立的学科。
进入21世纪,在现代生物学和医学的带动下,免疫学的研究内容得到了极大的拓展和丰富,同时免疫学的发展也开始向医学的各个领域进行渗透,并产生了许多免疫学的分支和交叉学科,如细胞免疫学、分子免疫学、神经和内分泌免疫学、遗传免疫学、生殖免疫学和行为免疫学等。近年来,计算机科学和其他工程科学与免疫学的交叉研究逐渐成为国际研究领域内的新方向,而且应用计算机对免疫系统及其各种机体功能与特征行为进行数学建模,更易于分析和解释各种免疫现象的内在机理。另一方面,免疫系统的许多功能特点和作用机理对于工程应用中许多复杂问题的求解起到了重要的启示和借鉴作用[49]。
2.人工免疫系统的发展历史
作为一个新兴的研究方向,生物免疫系统开始逐步被广大学者所关注,并且国际上的几位专家在人工免疫系统方面都作出了开创性工作。迄今为止,人们根据应用对象不同,从不同的角度模拟生物免疫系统,提出了不少有价值的AIS网络模型。其中,最为著名的是美国诺贝尔奖获得者Jerne在1973年提出的免疫网络理论[50]。1986年,Farmer等人基于免疫网络学说给出了免疫系统的动态模型[51],探讨了免疫系统与其他人工智能方法的联系,开始了人工免疫系统的研究。1989年,Perelson在前人研究的基础上,对独特型网络进行了深入研究[52]。他从抗体形态空间理论的角度出发,开创了用二进制编码描述抗体、研究免疫现象的方法,提出了一些有价值的学习算法构造思想。1990年,Farmer通过对免疫系统、神经系统和遗传系统的特点及其异同进行分析比较后,给出了基于联结主义的动态系统模型基本特点的描述。他们的研究工作为建立基于免疫原理的有效计算系统和智能系统开辟了新的道路。另外,Varela在1989年讨论了免疫网络以某种方式收敛的思想,以及免疫系统能够通过产生不同的抗体和变异适应新环境的思想[53],这些都为使免疫系统成为解决工程问题的有效灵感源泉作出了巨大的贡献。随后的研究者不断从生物免疫系统中抽取隐喻(metaphor)机制,用于人工免疫算法的模型设计、算法实现和工程应用。1996年12月,在日本举行的基于免疫系统的国际专题讨论会上首次提出了“人工免疫系统”的概念。随后,人工免疫系统进入了兴盛发展时期。D.Dasgupta和丁永生等认为人工免疫系统已经成为人工智能领域的理论和应用研究热点[54][55]。作为计算智能的崭新分支,人工免疫系统已成为许多国际期刊的重要议题[56][57]。从1997年开始,IEEE System Man and Cybernetics国际会议每年均组织专门的AIS研讨会(Workshop);IEEE Transaction on Evolutionary Computation在2001年和2002年还相继出版了AIS专著。值得一提的是,第一届人工免疫系统国际学术会议ICARIS(1st International Conference on Artificial Immune Systems)也于2002年9月在英国肯特大学召开。
目前,美国、英国和日本这3个国家的人工免疫系统研究处于领先地位,绝大部分科研成果皆来自于此。美国新墨西哥大学的Forrest较早地开展了基于人工免疫的网络安全方面的研究,并提出了计算机免疫学的概念[58];孟菲斯大学的Dasgupta基于免疫原理在计算机安全和异常检测方面进行了大量的研究[68];英国肯特大学的Timmis对基于人工免疫系统的机器学习和数据挖掘进行了系统性的理论研究[59];巴西坎皮纳斯大学的De Castro对人工免疫系统的模式识别、数据分析和函数优化等方面进行了研究[60]。此外,还有日本Nara科学技术学院的Ishida研究人工免疫系统在故障诊断中的应用;名古屋大学的Ishiguro则研究人工免疫系统在机器人行为规划中的应用[61]。
尽管我国对于免疫系统的研究要比其他国家研究时间短,但发展是很快的,并且部分国内的研究成果已经在国际上占有一席之地。我国关于免疫系统的研究特点和优势主要集中在免疫优化算法和理论方面以及计算机免疫系统方面。中国科技大学王煦法教授在国内较早开展了免疫优化算法方面的研究,并扩展到基于免疫计算的人工生命、入侵检测和优化计算等领域;西安电子科技大学焦李成教授提出了具有较完备理论基础的免疫优化算法,并著书阐述其在人工免疫系统研究方面取得的成果[6];武汉大学梁意文教授在计算机免疫系统方面的研究受到了国际上的关注[63];东华大学丁永生教授在免疫控制方面取得了可观的成就;重庆大学黄席樾教授提出了比较系统的免疫算法理论;华中科技大学肖人彬教授提出了工程免疫计算的概念并应用于智能优化[64];哈尔滨工程大学莫宏伟在免疫计算数据挖掘应用方面进行了有益的探索,并编辑出版了国内关于该领域的第一本著作[8]。
3.人工免疫算法研究现状
人工免疫系统研究领域的另一个热点是基于免疫原理的优化算法。人工免疫算法吸收了免疫系统的仿生隐喻机理,形成了问题求解的理论模型和计算方法。人工免疫算法目前没有统一的模式[66],即使在生物学基础上也不是统一的。不同于传统智能优化算法,免疫算法的生物学基础是多样的,如免疫网络、克隆选择原理、阴性选择等。目前,基于这些免疫学理论或机制已经开发出多种形式的算法模型,它是人工免疫系统的主要研究内容,也是免疫计算的主要形式。
人工免疫算法是面向问题的方法,自人工免疫系统发展以来,已经有许多用于不同领域的免疫算法被开发出来[67][68],这些算法大部分是利用免疫系统某一方面的机制或原理来设计新算法,或者是改进现有技术。人工免疫算法的思想最早由De Castro在2000年实现[69],其又在2002年发表文章细化了算法实现的细节[70]。文献[69]和[70]提出的算法是基于二进制编码的,而Wierzchon等提出了基于实数编码的广义人工免疫算法[71],由此完善了基于免疫机理的优化算法原理,形成了基本人工免疫算法的结构。在此基础上,对于人工免疫算法理论和改进的研究纷纷展开。
(1)基于免疫系统中的特殊机理的免疫算法
王磊[72]从先验知识中提取疫苗,将免疫系统的特异性免疫特征与遗传算法相结合,提出了一种新的免疫遗传算法;张军[73]将免疫调节原理中的浓度抑制机制融入算法中以保持种群的多样性,从而提出了基于免疫调节的共生进化网络设计方法;Chun[74]提出了基于体细胞理论和免疫网络理论的一种免疫遗传算法;Enaoh[75]提出了一种基于免疫抗体记忆的免疫算法;王煦法[76]和曹先彬[77]利用信息熵理论设计抗体浓度,所研究的算法已经有效地应用于TSP问题和装箱问题;韩生廉[78]等人受免疫系统抗体更新机制的启发,将抗体更新机制引入遗传算法,从而有效地防止了遗传操作中的早熟收敛;葛红[79]等人利用抗体亲和度和抗体密度指导抗体的繁殖率,对算法性能进行了一定的改善。
(2)基于人工免疫算法结构的免疫算法
刘若辰[80][81]等人对免疫单克隆机制和免疫多克隆机制进行了分析讨论;凌军[82]等人探讨了人工免疫算法中的个体多样性评价,提出了一种基于小生境技术的多样性抗体生成算法,可以很好地保持优化过程中抗体集合的多样性;宋丹[83]等人提出一种基于多种群的自适应免疫进化算法,引入记忆算子,充分利用优良基因信息指导后代生成,加快了收敛速度;李广强[84]等人将人机合作机制引入人工免疫算法,提出了人机合作的免疫算法,由设计者根据先验知识提供部分抗体个体,充分利用了先验知识来改善算法种群质量,并利用布局设计问题验证了算法的可行性和有效性。
(3)与其他智能算法相融合的混合算法
Wakizono[85]提出将基于免疫机制的进化算法应用于时变非线性系统的识别;蒋加伏[86]等人也提出了一种人工免疫算法和蚁群算法综合应用的混合优化算法,先利用蚁群算法产生初始抗体,再利用人工免疫算法进行优化;高鹰[87]等人提出一种免疫粒子群算法,结合了粒子群算法具有的全局寻优能力和免疫系统的免疫信息处理机制,改善粒子群优化算法摆脱局部极值点的能力;杜海峰[88]等人提出一种自适应混沌克隆进化规划算法,利用混沌方法进行克隆算法中的初始化和变异操作,对算法寻优性能有一定改善;曹先彬[89]等人利用免疫浓度调节机制保持个体的多样性,采用基于自组织临界思想的变异算子指导搜索,从而改善了算法的全局收敛性和收敛速度;李阳阳[90]将量子计算应用于人工免疫系统中的克隆算子,提出了一种基于量子编码的免疫克隆算法来求解SAT问题[91]。
由此可见,人工免疫算法本身所具备的特性决定了人工免疫算法对于各种优化问题的求解有着巨大的潜力,并已经成为人工智能研究的热点。可以预见,人工免疫优化算法将会在优化领域中得到广泛的应用。
1.4.2 人工免疫系统在入侵检测中的应用现状
随着网络时代的到来,计算机网络规模的不断扩大和入侵手段的日益多样化,对网络的各类攻击和破坏与日俱增,网络安全问题变得越来越重要,进行网络安全入侵检测已成为对网络系统进行安全保护的一种关键技术,成为近年来计算机网络研究的热点问题之一[92]。为了提高网络入侵检测的正确率,人们提出一种人工免疫的网络入侵检测算法。网络入侵检测是对任何企图损害系统的机密性、可用性和完整性等行为进行检测的网络安全技术。网络入侵检测系统(IDS)由硬件和软件组成,其对网络进行检测以发现可能的入侵[93]。
网络入侵检测方法包括异常入侵检测和误用入侵检测。异常入侵检测模型是检测与可接受行为之间的偏差,如果发现某项行为是不可接受的,那么就认为该行为是入侵。该检测模型漏报率低,误报率较低,由于不需要对每种入侵行为进行定义,因此该模型可以对未知入侵进行有效检测[94]。误用入侵检测方法的效果取决于检测知识库的完备性,存在不能发现未知的入侵行为,因此当前的网络入侵检测都是基于异常入侵检测方法的[95]。
早期的IDS系统都是通过监视与分析主机的审计记录检测入侵,该系统存在伸缩性不足的问题,不适合大规模网络环境的检测。后来有学者提出基于神经网络、支持向量机等机器学习方法,网络入侵检测技术得到飞速的发展,但这些算法缺乏自适应能力,检测的准确性和速度仍然存在问题,同时由于现代网络的攻击手段不断更新,不能适应网络安全现状[96-98]。
人工免疫是一种模拟生物免疫的人工智能技术,已经广泛用于计算机安全、组合优化、数据挖掘与分析、自动控制和模式识别等领域。网络入侵检测是保护计算机网络系统不受来自外部与内部的入侵行为的技术,与人工免疫系统具有相似性。网络入侵检测在网络中所扮演的角色类似于免疫的人体,因此根据人工免疫技术进行网络入侵检测[99]。
下面分别从国外和国内两个方面来介绍人工免疫系统在入侵检测中的研究和应用现状。
1.国外研究现状
在国外,将人工免疫系统应用于入侵检测的有:新墨西哥大学的Forrest、Hofmeyr小组;孟菲斯大学的Dasgupta小组和伦敦大学的Kim、Bentley小组。[100]
Forrest小组致力于建立一个计算机免疫系统,提出用反向选择算法NSA来产生成熟检测器(类似于达尔文进化论中优胜劣汰的自然选择算法),并首次提出“计算机免疫学”一词。Forrest小组基于免疫机制的入侵检测模型是一个基于网络的入侵检测模型,在这个模型中,整个系统由分布在网络中处于监听状态(“混杂”模式)的一组主机构成,每台主机是一个检测结点。在每个检测结点上,用于免疫识别的抗原是由TCPSYN请求包中的源IP地址、目的IP地址和服务端口3个属性构成的定长为L的二进制符号串。模型中的阴性检测子是免疫系统中B细胞、T细胞和抗体的综合体,数据结构与抗原相同,检测子与抗原的特异体互补结合以定长的连续位匹配函数来模拟。Forrest小组还提出了采用连续位匹配函数时提高成熟检测子生成效率的方法。
Dasgupta小组提出了一种实现入侵检测的免疫遗传模型,并给出了一种新的检测子结构,还提出了一个生成衡量不同危险级别的检测子的思想,这是该小组的主要贡献。不足之处在于其设计只是针对突发异常数据包的一类攻击,这种攻击很容易被发现,因此价值不高。
Kim小组描述了阴性选择、克隆选择和检测子基因库进化3种免疫机制的应用。在该模型中,用于免疫识别的抗原是一种聚集结构,模型中检测子的结构与抗原的结构相同,检测子与抗原是否匹配是通过所有属性的匹配分值之和是否超过某个闭值来判定的。系统由中枢入侵检测系统和周围二级入侵检测系统组成。在中枢入侵检测系统上存储着一个用于生成未成熟检测子的基因库,基因库最初是根据有关入侵的先验知识建立的,然后再利用成功检测到入侵的有效检测子的信息来进化,周围入侵检测系统以中枢入侵检测系统传送的成熟检测子进行入侵检测。
2.国内研究现状
国内将人工免疫系统应用于入侵检测的研究主要有:
赵俊忠等人结合多Agent和数据挖掘技术提出了一个基于免疫机制的入侵检测模型,该模型在数据挖掘技术的应用上与别人有所不同,强调不同用户行为的个体差异。挖掘不同用户个体行为的规律性和不同服务器的配置信息,因此获得了较高的检测率和准确性,并将检测范围扩展到了UDP数据包的检测。
潘志松等人提出了一个基于自然免疫和疫苗接种机制相结合的入侵检测模型以及相关算法。该算法充分考虑了数据包负载部分包含的入侵信息,建立反馈机制,并将疫苗接种机制引入入侵检测中,使入侵检测增强了对未知攻击的识别能力,并使系统具有自组织性、高效性和分布性。
邓贵仕等人对检测子的生成机制和匹配算法进行了较为深入的探讨,建立了一个基于免疫原理和Agent技术的三层分布式网络入侵检测模型,但该模型存在不足的地方,例如如何缩短阴性选择过程的时间,寻找更加高效的字符串匹配方法等。这些都是关系到系统效率的核心问题,需要作进一步的研究。
孙美凤等人针对流量特征,提出了对Hofmeyr自适应免疫系统模型的一种改进,新的模型保留了Hofmeyr模型的优点,可用于企业园区网,具有更强的能力,能为园区网提供全局的检测和保护。但其对用报文内容刻画的攻击无能为力,如各种特洛伊木马攻击,它以报文中具有某个子串为攻击特征。
胡翔等人基于对象免疫思想,提出了一个入侵免疫系统的构建方法,其核心是围绕对象行为模型定制免疫规则,使每个对象受到针对性的保护。吴作顺等人提出了一个基于免疫学的多代理入侵免疫系统模型,在该模型中,基于免疫学的安全代理能在联网节点之间漫游,监视网络状态。这些代理相互识别对方的活动行为,以等级方式进行合作,并根据底层安全规则采取相应的行动。移动代理具有自学学习能力,能动态适应周围环境,检测出已知与未知的入侵。多代理检测系统同时在不同层次监视联网计算机的活动情况,包括用户级、系统级、进程级和数据包级。
张勇等人提出了一个基于免疫原理的多代理网络入侵检测模型,该系统是一个分布式系统,各个检测代理之间也是松耦合的,可以相互代替,并在本地保存了入侵日志,安全性较高,但只能根据单个网络包来实现检测。
除此以外,吴泽俊等人提出了一个基于免疫的克隆选择算法,对入侵检测的免疫模型作了一些改进。马建伟等人提出一个生成“检测体”具有动态平衡的计算机免疫系统。刘赛等人提出了一种免疫遗传算法,能检测较大范围内的网络入侵,并能产生较好的模式识别器[100]。
目前,这些将人工免疫技术应用于入侵检测的研究有些只采用了部分免疫机制,缺乏完整性;同时,这些研究目前仍然停留在理论研究和探索阶段,所做的工作较为零散。
1.4.3 人工免疫系统在故障诊断中的应用现状及方向
故障诊断是现代自动化生产中提高系统可靠性和安全性的重要手段[101],在过去几十年的发展中,该领域已经取得丰硕的成果[102-106]。以旋转机械故障诊断为例,常用的诊断方法包括:基于概率统计时间序列的诊断方法、基于贝叶斯决策规则的模式识别方法、基于小波变换和分形几何的信号处理方法、基于人工神经网络的智能诊断方法、基于模糊神经网络的故障诊断方法、基于模糊逻辑推理的故障诊断方法,基于专家系统的故障诊断方法以及智能融合故障诊断方法等[107]。然而,这些方法都存在不同程度的缺点,如基于规则的方法需要大量先验知识,但是先验知识的获取非常困难[108];基于信号处理方法的难点是需要收集实际的故障样本,对于实验研究和现场情况有很大区别的情况,会影响诊断的可靠性[109];对于基于神经网络的方法,由于模型结构和物理意义不明确,需要足够多的训练数据对故障模式进行学习;在出现新故障时,需要对整个网络重新训练[110]等。
人工免疫系统作为一种新的人工智能方法应用于旋转机械故障诊断中,是最近几年发展起来的一个引人注目的研究方向。与旋转机械故障诊断的常用方法相比,人工免疫系统具有提供噪声忍耐、无监督学习、自组织、清晰表达知识、遗忘使用较少的知识、内容可访记忆等优点,同时具有分布式并行处理和鲁棒性[111]。因此,人工免疫方法克服了旋转机械故障诊断的常用方法的一些缺陷,不需要大量先验知识,不需要获取完整的异常样本,并且可以终身学习,建立多层诊断机制。显而易见,人工免疫方法为旋转机械的故障诊断提供了一种新思路。
1.旋转机械故障简介
旋转机械广泛应用于现代工业,它是各种机械设备最关键的部件之一。旋转机械的种类多种多样,然而电机仍是最重要的旋转机械[112]。电机大量应用于各种环境中,恶劣环境、误操作和动态载荷等因素均是磨损电机的主要原因[113]。感应电机故障主要分为相绕组的短路或断路导致的定子故障、转子/端环故障、气隙不规则和轴承及齿轮故障。根据IEEE-IAS的调查,定子、转子相关、轴承和其他故障分别占到26%、8%、44%、22%。其中主要元件故障,包括轴承、转子和定子相关的故障占到78%~92%[114]。电机匝间绕组短路、相间短路、转子断条、轴承破损均会导致早期故障[115]。在旋转机械中,基础松动、轴裂纹和轴磨损等故障都是缓慢形成的缓变故障[116]。机电系统中轴承的不均匀磨损、齿轮装置的部分齿轮磨损断裂和裂隙均会诱发间歇故障[104]。实际工作情况下,许多故障相互耦合形成复合故障,复合故障具有耦合、模糊等复杂特性[117]。
随着科学技术不断发展,旋转机械的结构变得规模更大,速度更高,对滚动轴承诊断、变速箱诊断和压缩机诊断等并发故障的准确性要求也有提高[118]。电机故障的早期检测和正确诊断是电机驱动系统获得安全可靠运行的关键,早期故障的检测和诊断可快速维修电机,缩短电机驱动系统的停机时间[119]。滚动轴承故障的准确诊断往往直接影响系统的准确性、可靠性和主机寿命[120]。随着预测与健康管理技术(PHM)的快速发展,各种诊断和预测技术已经发展为复杂的动态系统,旨在提高系统的可靠性和安全性[121]。近年来在线电机故障诊断的研究热度日益升温,原因在于在线故障诊断在为关键领域驱动系统提供容错能力方面起着至关重要的作用[122]。
2.人工免疫系统在旋转机械故障诊断中的研究现状
目前人工免疫系统的主要算法和模型有阴性选择算法、克隆选择算法和免疫网络模型等。其中,阴性选择算法由于其不需要先验知识,能够利用少量的正常样本检测出无限的异常样本的独特特点,已经成为人工免疫系统的核心,发展成为旋转机械故障诊断应用中最主要的人工免疫方法。人工免疫方法在旋转机械的故障诊断中以阴性选择算法应用最为广泛。
(1)阴性选择算法
文献[123]提出了一种故障诊断系统的框架,阴性选择算法与变异结合,生成实值向量检测器,通过模糊聚类算法将自我集合和非我集合映射到正常模式和异常模式,采用改进欧几里德距离表示亲和力,并设置单独的故障检测器识别未知故障,再在线检测轴承故障的发生。文献[124]随机生成初始检测器,并采用实值向量表示检测器和样本数据,构建故障诊断系统。系统状态空间分为正常空间和故障空间,然而两类空间的分布并不规则,最大范围地占据非己空间并尽可能减少故障空间的重叠,可以提高旋转机械故障诊断的实时性和准确性。文献[125]设计T模块和B模块,建立免疫系统框架,T模块采用实值向量阴性选择算法生成异常检测器,B模块响应系统实际状态,形成告警模块反馈至T模块。文中将特征向量空间简化为二维[0,1]空间,将超球体检测器简化为平面圆,产生可以相互覆盖的检测器。但因为其检测器可以覆盖,因此初始分布策略需要进一步优化。上述文献采用的均是固定半径的检测器,检测器数量随正常空间大小成倍增加[136],在故障空间中覆盖率与检测器重叠很难均衡,限制了此类阴性算法的应用。
文献[126]提出一种持续学习的故障检测方法,采用实值阴性选择算法,利用PCA(Principal Components Analysis)降维将数据投射到一个单元超立方体中,再将自我集合和检测器表示成超球体,检测器半径动态决定,停止检测器更新的标准是覆盖率达标。文献[127]将旋转机械的轴心轨迹等3D参数图像转化为2D图像,将非己空间异常程度分级,采用超球体检测器表示自我空间,优先克隆半径较大的检测器,可以有效减少空洞现象并尽可能减少检测器数量。文献[128]基于变半径检测器和免疫记忆细胞,检测器的中心和半径变化存储到记忆细胞中,当新的检测器产生时,通过动态调整其位置使覆盖率提高。上述文献采用了变半径检测器,有效减少了检测器之间的重叠。
文献[129]将故障样本映射成相应的二进制编码,根据编码范围将复杂故障解耦,变为多个单一故障,采用R连续位匹配规则进行样本和检测器的匹配,进行旋转机械故障诊断。但是二进制编码难以表示复杂的自我/非我语义空间,匹配规则缺乏物理意义。文献[130]采用实值匹配算法的阴性选择算法产生典型故障样本,作为径向基函数神经网络的输入,用于滚动轴承故障诊断。文献[131]基于随机实值阴性选择算法,对于自我集合小的系统,基本阴性选择算法产生检测器的数量大的缺点,在训练阶段,由正常样本和已知故障样本作为自我空间,扩大了自我集合的范围,探测阶段自我集合则只包含正常状态。文献[132]中不使用实值阴性选择算法诊断未知数据集,而是用来生成未知故障样本的检测器,作为训练支持向量机(SVM, Support Vector Machine)算法的输入,解决了常规方法缺少训练样本的问题。文献[133]提出了一种免疫相关向量机,该方法利用实值阴性选择算法产生检测器,并将其作为异常样本与正常样本一起训练相关向量机,解决了故障采样数据缺失或不完整的训练问题。
文献[134]采用变半径实值向量检测器,利用欧几里德距离表示测量数据与检测器的距离。其独特之处在于,训练多个检测器,每个检测器对应于一种特定的涡轮机故障,首先检测故障的发生部位,然后判断故障种类。文献[135]提出了一种分层故障诊断方案,第一阶段根据激活检测器的数量进行电机故障诊断,第二阶段根据激活的检测器识别故障类型。文献[136]提出疫苗作用抗体的改进方法,每种抗体只响应一种故障,对抗体编号排列,根据所触发的抗体编号即可判断发生了哪种故障。文献[137]使用电机正常特征信号产生NSA(Negative Selection Algorithm,反向选择算法)检测器,检测电机定子和转子的早期故障。
阴性选择算法不需要先验知识,能够根据少量正常样本区分异常状态和正常状态,解决了实际工程中难以获取完整异常列表的问题。出现新故障时,阴性选择算法不需要重新训练,只需增加检测器或重新分布检测器,即可完成对新故障的检测。阴性选择还具有记忆功能,对于出现过的故障,阴性选择能够通过记忆检测器快速诊断。但是阴性选择算法不能够识别故障种类,初始检测器的生成会导致耗时量大。而且在样本表示、检测器表示等方面也需要进一步完善。
(2)克隆选择算法
文献[138]利用克隆选择算法在线更新检测器,实现在线持续学习,克隆选择算法有效提高了异常空间的覆盖率,并且保持检测器数量在一个较低的水平。未被激活的检测器并不删除,其有助于发现新的故障。文献[139]中,每个抗体编码为二进制字符串,采用克隆选择算法优化支持向量机的内核和惩罚参数,对转子断条和定子故障进行分类。文献[140]首次提出了基于免疫的自动分类规则,应用于故障电机的诊断。基于每个规则的信任和支持度,利用克隆选择产生关联规则集,作为感应电机故障诊断分类规则。文献[141]中,为了解决克隆选择算法随机突变导致收敛速度慢的问题,将粒子群算法引入克隆选择中,每个检测器作为一个粒子,收敛速度通过演化方程得到提高。文献[142]采用粗糙集作为SVR(回归型支持向量机)的预处理器,选择输入变量的一个子集,并采用免疫克隆算法优化SVR参数。文献[143]采用表达树描述抗体,使用克隆选择算法设计分类器,其有效性在不同转速的旋转机械上得到验证。文献[144]首先使用遗传算法优化检测器,占据非我空间的最大覆盖空间,然后根据克隆选择算法进一步微调,优化检测器的中心和半径。文献[145]首先确定神经网络结构和隐层节点数,然后利用免疫遗传算法优化,提高了RBF(Radical Basis Function,径向基函数神经网络)的收敛速度和识别率。文献[146]采用克隆选择算法和遗传算法优化RBF神经网络的结构,基于密度和适应度的选择概率提高了神经网络的收敛性能。
克隆选择具有良好的优化能力和记忆能力,可以在全局范围内找到近似最优解,也适用于保留多个局部最优解。与遗传算法相比,克隆选择算法由于没有“交叉”环节,因此收敛速度更快。但是,克隆选择算法的亲和力计算,增殖复制算子和变异算子还缺少统一范式。
(3)人工免疫网络
文献[147]利用aiNet免疫网络动态调整检测器数量,实现故障在线检测。文献[148]中,B细胞由原始数据产生的B细胞网络形成的初始个体和克隆突变产生的克隆个体组成,当抗体相互识别时产生抑制,利用免疫网络理论避免抗体无限增长,减少数据冗余。文献[149]中,免疫网络理论用来避免数据冗余,优化RBF神经网络的隐层。文献[150]提出一种改进的基于免疫网络模型的故障诊断算法,根据抗体群和抗原群的匹配关系,自适应调整剪枝和抗体亲和力阈值的规则,使抗体群能够更好地覆盖故障样本空间,克服了aiNet网络不能识别新故障的缺点。文献[151]进一步讨论了剪枝门限、误诊率和漏诊率之间的关系。文献[152]融合克隆选择算法和RAIN免疫网络,提出群体网络算法,并对风机故障进行诊断。
人工免疫网络研究系统在动态环境中如何保持免疫稳定,抗体群之间、抗体群和抗原群之间相互制约的关系,避免抗体群的无限增长,减少数据冗余,从而保证适当的诊断率和诊断时间,维持故障诊断系统的动态平衡。人工免疫网络发展至今已经出现了各种学说,但是相对于自然免疫系统,免疫网络的机理还不完善,对于剪枝门限、亲和力阈值等参数的合理选取还需要进一步研究。
3.人工免疫系统在旋转机械故障诊断中的研究成果
人工免疫系统在旋转机械故障诊断中的研究正处于发展阶段,国内外专家学者针对旋转机械故障的缓变、间歇、复合等特点,对人工免疫系统进行了各种改进,并且取得了一系列宝贵成果。现阶段的研究成果主要集中在以下几个方面。
(1)将无量纲指标作为检测器的样本提高诊断效果
在利用振动信号进行旋转机械的故障诊断中,时域振动波形是最简单、最直接的表现形式。根据振动信号幅值获得概率密度函数,衍生出幅值域中的均值、斜度、峭度等属于量纲指标。无量纲指标由两个具有相同量纲的量的比值组成,当它描述某一特定体系时具有一定的物理意义。无量纲诊断是一种将“无量纲参数”用于设备故障诊断的技术方法[153]。在时域中,量纲指标对故障敏感,但极易因负荷、转速等条件的变化而改变。采用阴性选择算法对其编码,在实际中很难区分。无量纲指标对干扰不敏感,但它难以搜索故障特征之间的关系[190]。文献[154]采用连续位部分匹配准则,进一步将多个无量纲免疫检测器同时进行交叉检测,再进行集成、融合,从而能较全面地获得故障信息;最后将离线训练后的免疫检测器进行在线故障检测。文献[155]基于人工免疫和无量纲参数,提出了旋转机械诊断模型和算法。该模型使用故障的独特性质一一映射,可用于单一或复合故障诊断。文献[156]离线构建无量纲免疫检测器,将每个检测器诊断结果转化成置信度分布形式,解决了无量纲参数故障范围有重叠的现象,以实现目标的在线故障诊断。
(2)阴性选择检测故障种类
基本阴性选择算法只能将异常状态和正常状态区别开来,并不能真正识别故障种类,不能满足实际工程的要求。针对这个问题,一些学者开发了能够检测故障种类的阴性选择算法。文献[157]针对多种故障训练多个检测器,每个检测器对应某一种故障,根据被激发的检测器便可获得故障种类。文献[158]将故障诊断分为两层,第一层只进行故障检测,第二层检测故障种类。文献[136]开发了多个抗体,并对每个抗体编号,根据被激发的抗体编号判断故障种类。
(3)克隆选择算法优化检测器
阴性选择算法的初始检测器是随机产生的,其效率往往不高,因此阴性选择经常与克隆选择算法结合,利用克隆选择算法的优化特点,提高检测器的覆盖率,减少检测器的数量。例如,在文献[159]中,阴性选择算法与克隆选择算法结合优化检测器,以产生最佳的异常检测率。文献[138]使用克隆选择算法在线更新检测器,在保持低数量检测器的情况下有效提高了异常空间的覆盖范围。
(4)克隆选择算法用于其他故障诊断方法的参数优化
克隆选择算法具有良好的全局搜索能力和收敛速度快的优点,常常用于参数的优化。支持向量机目前已成为软件计算最流行的分类方法之一,然而支持向量机方法的分类精度取决于内核和惩罚参数。文献[139]采用三相电机电流,基于Park's向量方法构建特征向量,然后利用人工免疫系统调节支持向量机的内核和惩罚参数,用SVM分类识别转子断条和定子短路故障。基于神经网络的方法已成功地开发并应用于故障诊断领域。当人工神经网络的输入和输出选择恰当时,神经网络可代替基于知识的诊断系统。神经网络由学习算法和结构参数直接影响算法性能。普通人工神经网络学习算法极易陷入局部最小化,从而导致大的逼近误差。文献[160]利用人工免疫系统定义一种数据聚类算法,自适应地选择RBF神经网络的隐层中心数量和位置。
4.人工免疫系统在旋转机械故障诊断中的发展方向
人工免疫系统为旋转机械故障诊断提供了新思路、新方法,然而人工免疫方法的研究还只是集中于简单的隐喻和直接应用,在实际的旋转机械故障诊断应用中还需要进一步贴合工程需要。针对目前的研究现状,应用于旋转机械故障诊断的人工免疫系统还存在以下的问题值得研究。
(1)阴性选择算法实时性与覆盖率的均衡问题
阴性选择算法中,旋转机械的正常模式和异常模式通过检测器检测,检测准确性依赖于检测器对非我空间的覆盖率,覆盖率越高,准确性越高。但是检测器的数量越多,实时性也就越差。因此,如何克服实时性与覆盖率的矛盾是一个值得深入研究的课题。
(2)阴性选择算法中初始检测器的效率有待提高
阴性选择的初始检测器选定后,再通过一个阴性选择的过程进行故障诊断。由于初始检测器是随机产生的,检测器的数量越多,阴性选择的过程也就越长。如何开发效率更高的初始检测器生成规则,是阴性选择算法中的挑战性问题之一。
(3)免疫算法和免疫机理有待进一步开发
在旋转机械故障诊断中应用的各种免疫算法和模型虽然得到了较好的效果,但对于人工免疫系统的构建仍显得有些粗糙,生物免疫系统的很多复杂机理没有在人工免疫系统中得到描述和应用,这会影响人工免疫算法有效性的提高,作为机理性的研究依然是人工免疫系统的基本问题。
(4)免疫算法与其他算法互补
虽然克隆选择算法在与SVM、神经网络等智能方法的结合优化方面得到了应用,但是总体来说,将人工免疫算法和其他算法相结合的理论体系、实验验证等方面还有很大的可拓展研究空间。在实际操作环境中,旋转机械会出现一些带有复合、模糊、间歇性质的故障,人工免疫系统可以与模糊系统结合,将人工免疫系统中诸如检测器半径、克隆个体数等固定参数模糊化,可以改善人工免疫系统应对故障诊断中不确定性问题的能力,实现对旋转机械复合故障、间歇故障等的正确诊断。