1.1.2 可靠性概论

对于一个完整的可靠的电子组装制造过程而言,首次通过SMT或THT技术获得了组件并没有达成最终的目标,其中还必须通过各种可靠性试验的考核以及失效分析手段,暴露和分析组件所隐含的缺陷以及造成缺陷的根本原因,并且针对这些原因通过工艺优化、物料控制及设计进行改进,不断地改进和提高焊点或组件的可靠性与质量,最终才能获得符合质量目标的组件和稳定的工艺条件。本书的第一部分重点讨论确保电子组装质量的可靠性工程技术,这些技术也理应成为制造过程收关的重要一环。

电子组件的可靠性取决于元器件的可靠性和互连焊点的可靠性。由于元器件种类繁多且自有规律,需要有专门的著作来讨论。本书主要讨论经过组装技术生产获得的PCBA的互连可靠性问题,而这一问题的关键则是如何既获得良好的可靠的焊点,又不伤及周围的元器件和材料。在展开讨论焊点的可靠性试验与失效分析技术之前,有必要先介绍一下有关焊点可靠性的基本概念与基础知识。

1.研究焊点可靠性的意义

焊点通俗地说其实就是一个通过钎焊工艺形成的一个“接头”,通过这个接头就可以将不同的导体或功能零件连接在一起。对于本文要讨论的焊点则是限定在印制电路板与零部件之间起固定作用的接点,元器件就是通过这一接点输入、输出信号而发挥其作用的。因此,焊点最基本的作用就是固定零部件,确保这一机械连接的牢固,然后在此基础上实现电气连接,传导电信号,最终实现零部件以及PCBA的设计功能。从这个意义上讲,焊点是否可靠地持续保持良好的机械连接与电气连接的功能对于整机设备来讲至关重要。因为即使一个焊点发生不良或不可靠,也会导致整个设备异常甚至失效,严重的会引起灾难性的责任事故,如阿波罗号航天飞机的事故、火箭发射失败等。此外,焊点还有散热功能,这一点对板级可靠性也非常重要。

对于一个设计定型后持续生产的整机设备产品,决定其功能和质量的核心就是其PCBA,因为其他部分相对简单得多,很少有因为机壳或压缩机之类的机械部件不良引起的质量问题。而决定PCBA固有可靠性的因素主要有两个,一个是各元器件的可靠性,另一个就是电路板与元器件之间互连的可靠性。任何一个元器件或是焊点的不良都可以导致设备发生故障。而据美国空军的统计数据,焊点失效导致的故障超过总故障的30%。可见,在影响整机设备的可靠性方面,焊点的质量与可靠性和元器件一样重要,意义一样重大,即使看起来焊点似乎更普通,更不引人注目。

2.可靠性基本概念

在人们的印象中,“可靠”的意义似乎就是“不出问题”,或者没有故障等,对于SMT焊点而言就是焊点不出问题。可以说这是人们对可靠性最初认识的一种通俗的说法。那么,到底什么是可靠性?如何对可靠性进行度量呢?按照国家标准《可靠性基本名称及术语》(GB 3187—1982)及国家军用标准《可靠性维修性术语定义》(GJB 451—1990)的定义:可靠性为“产品在规定的条件下和规定的时间内,完成规定功能的能力”。为了表征这种“完成规定功能的能力”,技术上使用概率论与数理统计的方法来定量表述。定量表示产品可靠性的特征量有可靠度(Rt))、累积失效率(Ft))、失效率(λ)及平均无故障工作时间(MTBF)等。

所谓可靠度Rt)就是产品在规定的条件下,完成规定功能的概率。累积失效率其实就是累积的失效产品数占总量的比率。可靠度与累积失效率之间的关系可以用下式来表示:

所谓失效率,就是指产品单位的时间内失效的概率。而平均无故障工作时间,是指产品无故障工作时间的平均值。这里所说的产品就是焊点。通常来讲,表征焊点与元器件的可靠性的高低用失效率来表示,而对于设备的可靠性水平则多用可靠度或平均无故障工作时间来表达。这里多次提到的“失效”,是指产品丧失应有功能或降低到不能满足规定的要求。而失效模式则是失效现象的表现形式,与产生原因无关,如开路、短路、参数漂移、不稳定等。失效机理则是失效模式背后的物理化学变化过程,并且对导致失效的物理化学变化提供的解释,如银电迁移导致的短路。在工程上,有时会把导致失效的原因说成是失效机理。另外,值得注意的是,可靠性工程中所说的应力不是物理学上的机械应力,而是泛指驱动或阻碍产品完成功能的动力和加在产品上的环境条件(如温度、湿度、电压、振动等),这也是产品退化的诱因。

根据可靠性的定义,产品的固有可靠性是随设计的修改、工艺的变更以及使用条件的不同而变化的。因此,在评价或分析产品可靠性时,必须指定“规定的条件”和“规定的时间”以及需要“完成规定的功能”。否则,这个能力水平即可靠性水平就不可确定。因此,可靠性与“规定的条件”“规定的时间”以及“规定的功能”密切相关。例如,汽车音响,在北方的沙漠地区使用或是在海南岛地区使用,其寿命或可靠性就差别极大。这里所说的“规定的条件”就是指产品的使用条件和环境条件。另外,产品的可靠性一般都会随时间的推移而不断降低,它是时间的函数,产品使用一天的可靠性与使用一年以后的可靠性水平截然不同,因此必须限定“规定的时间”。此外,“规定的功能”是指产品的主要性能指标与技术要求,完成或达到这些指标或要求的能力则跟指标与技术要求的高低有关,指标高,完成的能力的可能性就会下降,反之则会上升。这些指标或要求实际上就是产品失效的判断依据,没有完成这个规定的功能就是失效了。

3.可靠性试验概述

从广义上来说,凡是为了了解、评价、分析和提高产品可靠性水平而进行的试验,都可称为可靠性试验。从这个意义上讲,在产品设计到制造、鉴定到使用的每个阶段都需要进行可靠性试验。例如,在设计阶段,我们需要了解所设计的产品或焊点是否满足可靠性指标的要求,要进行可靠性试验。在生产制造阶段,需要了解生产工艺是否满足要求,要进行可靠性试验。在工艺定型后的正式生产时,需要对其产品的可靠性水平进行鉴定,也要进行可靠性试验。在使用阶段,由于使用现场与实验室条件的差异,同样要进行现场的可靠性试验。通过这一系列的可靠性试验,我们期望可以达到保证出售的产品的可靠性水平满足要求的目标。具体讲,就是通过可靠性试验可以发现在设计、原材料、结构、工艺和环境适应性方面存在的问题,再通过失效分析手段分析问题产生的原因,进行有效的改进,直到达成最终的设计目标,并可为后续的可靠性管理提供有效的依据。

为了达到不同的目的可以选择不同类型的试验方法。可靠性试验有不同的分类方法,如根据环境条件分为模拟试验和现场试验;根据试验的性质,可以分为破坏性试验与非破坏性试验;按照项目则可分为环境试验、寿命试验、加速试验和各种特殊试验。但通常惯用的分类方法是将其分为五类,即环境试验、寿命试验、筛选试验、现场使用试验和鉴定试验。而鉴定试验又可以分为产品的可靠性试验与工艺的可靠性试验,产品的可靠性试验一般在新产品设计定型和生产定型的时候进行,目的是考核产品的指标是否满足预定的设计要求。而工艺(含材料)的可靠性试验主要用于考核生产工艺和材料的选择与控制能力是否能保证所制造的产品的可靠性与质量等级的要求。由于SMT工艺从有铅的传统工艺到无铅的环保工艺,主要涉及工艺与材料的转换,因此,更多地是需要做工艺的可靠性试验,以确认所更新后的工艺和材料是否满足预期的可靠性要求。

由于无铅制造过程涉及的因素有很多,仅无铅焊料在业界都无法统一,各种合金组成的无铅焊料以及不同的表面处理,导致影响无铅产品可靠性的因素也有很多,且无铅实施的时间不长,与有铅产品的大量的可靠性数据积累相比,无铅产品的可靠性数据缺乏积累。这也就严重制约了无铅焊接技术的发展,导致在某些高可靠性要求的领域仍然得到豁免而继续使用有铅的焊接工艺,这样无铅有铅混装的工艺就产生了新的可靠性问题。为此,除了进行上面提到的可靠性鉴定试验,业界仍然需要针对无铅焊点进行必要的寿命试验,以获取无铅焊点的寿命特征。这种方法是模拟焊点的使用条件,在不改变失效机理的条件下采用加大应力缩短试验时间的加速寿命试验的方法。尽管如此,为了获得焊点的特征寿命,试验的时间仍然较长,投入仍然很大,在业界一般的中小企业都难以单独承担。所以,现在业界大多采用工艺的可靠性试验的方式,结合一定的机理分析来确保消费类产品的可靠性满足要求。

4.确保产品可靠性的基本工作内容

可靠性工作是一项系统工程,它贯穿从产品设计到使用的整个生命周期。要确保产品的可靠性符合设计和使用的要求,显然仅仅通过可靠性试验的方法不能达到确保可靠性的目标。由于篇幅以及本书主旨的关系,在此只简单地讲述其他相关的可靠性工作的基本内容与工作思路。

每个产品的诞生都是从设计开始的,在产品的研制阶段必须首先进行产品可靠性规划,需要设计的产品将来在什么条件下使用,使用的寿命如何,寿命期内故障的容忍度如何,可靠性要求到什么程度等,都需要做好规划或设计。然后根据所使用的材料与工艺参数对进行可靠性设计和预计,预计可靠性能满足要求后方可进行产品样机的研究,并对产品的设计方案进行可靠性分析,通过可靠性试验发现问题与隐藏的缺陷,针对缺陷进行分析改进,即所谓的可靠性增长试验。这个过程反复进行,直至设计的产品的可靠性满足要求,设计才能定型。

设计定型后的产品就应该开始设计生产工艺,进入试制阶段。这时就要根据产品设计要求,选择工艺、材料、部件进行试生产,通过对试生产的产品的特征参数进行检测,获得工艺优化的初步依据,选择最佳的工艺参数和适合的原材料。正式量产前还需对产品进行可靠性试验,以进一步确认最佳的工艺与原材料选择方案,并验证试制样品的可靠性是否达到规划要求。

量产阶段需要加强工艺以及原材料的质量控制,并定期对产品进行例行的可靠性试验,以保障批量生产时工艺、材料、产品的一致性和稳定性。到了应用阶段,就应该做好维护工作,确保产品在产品设计的使用条件范围内使用,并及时准确地收集产品的实际使用的可靠性数据,准确反馈到研制方以便成为产品升级换代时的改进依据。

对于焊点的可靠性工作,建议考虑采用如下的工作思路:

● 收集产品历史经验与现场使用的可靠性数据;

● 分析建立主要的失效模式及其分布;

● 通过失效分析方法寻找产品失效的机理;

● 对新产品新工艺进行可靠性设计,并用可靠性试验验证其设计;

● 通过加速试验获得新设计的焊点的寿命特征;

● 建立加速试验数据或特征寿命和实际使用寿命之间的对应关系,得到评价数学模型;

● 利用数学模型描述产品寿命的变化规律;

● 基于失效机理与数学模型,通过软件仿真在设计阶段预测产品的寿命;

● 用加速试验方法进行产品的可靠性与寿命认证与评估;

● 定期进行可靠性试验,确保产品与工艺的一致性与稳定性;

● 进行现场使用的维护,收集可靠的现场使用数据,为下一步改进做准备;

● 建立故障报告、分析和纠正措施系统(FRACAS)。

综上所述,可靠性试验贯穿整个产品的生命周期,在确保产品可靠性的工作中,可靠性试验是其最重要的组成部分,是保证或提供产品可靠性的必要手段。可靠性试验的数据和结论是合理使用产品、正确设计产品、选择制造工艺和实施工艺控制的重要依据。

5.影响焊点可靠性的主要环境应力

焊点是由不同材料通过SMT或THT工艺形成的一个连接点,本身可能因为处于不同的设备中而遇到不同的使用环境,因此,受到的环境应力及其水平都不尽相同。但是根据焊点的结构特点,可以总结出焊点可靠性的主要影响因素有两个方面:一是热应力,即由于使用现场的环境温度变化,或者工作状态与非工作状态导致的温度变化,这种温度变化会导致焊点中不同材料之间的不同幅度的应变,这种反复的应变会直接引起焊点的失效(见图1.1);二是机械应力,由于焊点的基本作用就是固定元器件,起到机械连接的作用,而设备的使用运输过程经常会遇到振动、弯曲、跌落等规律性的或以外的机械应力,这种应力也会导致应变的产生从而引起可靠性的变化(见图1.2)。此外,长期的高温环境也会导致焊点老化,金属间化合物的生长引起脆性增加,严重的还会产生Kirkendall空洞(见图1.3),导致焊点可靠性降低。图1.4是美国空军统计分析的影响互连可靠性的环境应力的影响因子。焊点的可靠性试验将选择主要影响应力来进行。

图1.1 热应力对焊点可靠性的影响

图1.2 机械应力对焊点可靠性的影响

图1.3 焊点高温老化后在金属间化合物界面产生的Kirkendall空洞(SAC405/Cu,175℃×1000h)

图1.4 环境应力对互连(含焊点)可靠性的影响因子(Source:U.S.Air Force Avionics Integrity Program)

6.焊点的主要失效模式

经过大量现场的数据收集与分析总结发现,在符合验收标准的合格焊点中,主要的失效模式可以分成两大类:一类是疲劳断裂引起开路失效,这种疲劳失效可以是机械应力导致的机械疲劳失效,也可以是热应力导致的热疲劳失效;另一类是腐蚀失效,包括化学腐蚀失效与电化学腐蚀失效,这种腐蚀失效可能还包括电迁移过程或绝缘电阻下降。这两种失效模式都与时间有关,随着时间的推移,失效率会逐步增加。疲劳开路失效还可以表现为焊点的阻值增大。腐蚀失效则更多地表现为焊点变色,以及漏电等绝缘性下降。腐蚀失效虽然常见,但与疲劳失效相比不太重要,并且容易控制或预防,只要将工艺中残留在焊点表面或周围的残留物清理干净,就可以防止腐蚀失效的发生。

需要指出的是,在工艺过程中,由于工艺未稳定产生的异常焊点或不合格焊点,不在此讨论之列。因为这些现场问题的产生属于狭义的现场质量问题,产品都不合格根本不能继续谈论可靠性问题。这些质量问题只需通过一般的检测就可以发现,并可通过工艺的优化与材料的选择来改进,如连焊、拉尖、孔洞、润湿不良、立碑等。讨论可靠性或寿命问题通常基于产品符合基本标准的质量基础之上。

7.焊点主要失效机理

看起来简简单单的一个焊点其实并不简单,它包括焊盘、焊料及引线脚等部分,甚至还包括焊盘下面的基材,以及这些材料之间形成的金属间化合物。形成焊点的过程涉及冶金学、物理化学、材料学等学科的理论。因此,可以说焊点并不简单。由于焊点的结构包括了焊料、焊盘、引线脚以及基材,而这些材料的热膨胀性能各不相同(见表1.1),在焊点所在的设备工作或处于不同的环境时,随着季节与工作状态的变化,焊点会随时遭遇到不同的循环热应力,由于焊点中各材料的膨胀性能的差异,导致遭受不同程度的应力—应变的焊点产生疲劳裂纹,随着裂纹的扩展最终导致焊点开裂失效。如果焊点中再有隐含的缺陷,焊点就会出现早期失效或寿命折损。图1.5就是这种疲劳失效过程的一个典型的例子。

表1.1 焊点相关材料的典型热膨胀系数(CTE)

图1.5 焊点经过温度循环(-40~125℃,1 cycle/h×1000cycles)前(左)后(右)的切片照片

至于焊点的腐蚀失效,主要与工艺过程中导致的在焊点表面或周围的活性残留物有关,通过大量的失效分析发现,腐蚀物主要来源于工艺过程中助焊剂的残留,助焊剂中的酸性物质或卤素离子的存在,当它们吸潮后即可形成腐蚀性极强的酸,这些酸性物质很快将焊点表面或周围的金属变成离子,在设备工作的时候,邻近焊点之间的电位差形成了电场,导致离子的迁移以及电化学腐蚀加剧,最终随着时间的推移,焊点会被腐蚀并可能在焊点之间长出枝晶(见图1.6),PCBA就会报废。这种失效现象一般都有规律,一旦出现问题,整个批次的PCBA或设备都将失效或遭到破坏。不过,令人感到欣慰的是,与疲劳失效的机理不同,这种失效机理反映的失效模式通常在工艺或材料上采取措施就容易得到控制。而疲劳失效则无法得到彻底的控制,疲劳失效是迟早的事,因此它最终成为焊点最主要的失效机理。

图1.6 焊点发生腐蚀以及电迁移的SEM照片