2.4 蛋白质的四级结构

每一种天然蛋白质都有自己特定的空间或三维结构,这种三维结构常被称为蛋白质的构象。构象(conformation)是指具有相同结构式和相同构型的分子在空间可能存在的多种形态,即取代基的单键旋转时形成的不同立体结构或原子的空间排列。构型(configuration)是指立体异构体分子中取代基在空间的相对取向,如L-型和D-型氨基酸。蛋白质复性过程中可形成若干种构象,但两种构型之间很难互相转变。

特定蛋白质的三维结构由其氨基酸残基序列决定,而蛋白质的生物功能则由其三维结构决定。特定的蛋白质通常具有唯一的三维结构,保持蛋白质结构稳定的作用力是非共价键或弱的相互作用,包括氢键(hydrogen bond)、疏水作用(hydrophobic interaction)、离子键(ionic bond)和范德华力(Van der Waals force)等,此外二硫键在稳定某些蛋白质的构象方面也起着重要作用。多数蛋白质的多肽链不是呈线性伸展的,而是以一定的方式折叠成特定的空间结构。具有生物功能的天然蛋白质(native protein)的构象往往是热动力学上最稳定的,包含最低的Gibbs自由能,但也不是固定的静态三维结构,在溶液中通常处于动态变化中,并通过两种或更多种构象间的转换来实现其生物功能。

蛋白质的四级结构学说是研究认识蛋白质空间构象、由简单到复杂逐级建立的层级体系,随着研究的不断深入和细化,又在二、三级结构之间划分出超二级结构和结构域两个层次。

2.4.1 蛋白质的一级结构

1969年国际纯粹化学和应用化学联合会(IUPAC)规定蛋白质的一级结构(primary structure)是指多肽链中的氨基酸残基的序列。理论上讲,蛋白质的组成和大小是没有限制的,在一条多肽链中,每个氨基酸残基的位置都对应有20种不同的选择,这就可能有大量的、不同的蛋白质存在,如由n个氨基酸残基组成的蛋白质,就可能有20n个序列。但实际上天然蛋白质的大小和组成都受到某些限制,大多数肽链的长度在100~1000个氨基酸残基之间,而且20种氨基酸在蛋白质中出现的频率也不尽相同。蛋白质中最常见的氨基酸残基有Leu、Ala、Gly、Ser、Val和Glu;不常见的有Trp、Cys、Met和His。由于每个氨基酸都具有各自不同的特性,因此蛋白质特定位点的氨基酸出现改变时将会影响其性质。氨基酸序列变化不仅影响蛋白质的高级结构,而且直接影响其生物功能,甚至导致功能异常或病变。

1904年芝加哥James Herrick医生发现的镰刀形细胞贫血病(sickle-cell hemoglobin,HbS)是最早被认识的一种分子病,这种疾病是由于遗传基因突变导致血红蛋白分子中氨基酸残基被更换所致。人的血红蛋白(hemoglobin,HbA)由4条多肽链(两条α链和两条β链)组成,变异的血红蛋白分子中两条α链与正常的血红蛋白完全相同,但两条β链上从N端开始第6位的谷氨酸(Glu)残基被缬氨酸(Val)残基取代(图2.35)。Glu与Val在带电性质和形成氢键的能力上存在很大的差异,导致血红蛋白在空间结构上发生了显著的变化,形成了不溶性纤维状的血红蛋白S,使红细胞变形。正常的红细胞平滑而有弹性,而变异的细胞呈镰刀形(图2.36),细胞易破裂,常导致溶血性贫血,而且不易通过毛细血管,因此血液循环被破坏,严重时流经某些组织的血液会被完全堵塞,导致严重的组织损伤,甚至组织死亡,最终影响器官的正常功能,这是镰刀形细胞贫血病患者死亡的主要原因。

图2.35 镰刀形血红蛋白分子的氨基酸置换

图2.36 正常红细胞(a)和镰刀形细胞贫血病的红细胞(b)

2.4.2 蛋白质的二级结构

蛋白质的二级结构(secondary structure)是指肽链局部的空间排列,即肽链在链内或链间由氢键维系的稳定构象。通常二级结构是指α-螺旋、β-折叠和β-转角。

1)α-螺旋

1951年Pauling和Corey分别预测和验证了蛋白质中α-螺旋(α-helix)结构的存在,并共享了1962年的诺贝尔化学奖。α-螺旋(图2.37)是蛋白质中最常见、最典型、含量最丰富的二级结构,通常为右手螺旋,即当拇指指向螺旋上升方向时,螺旋转向右手卷曲的手指方向。α-螺旋中氨基酸残基的Cα—C键旋转ψ=-45°~-50°和Cα—N键旋转ф=-60°,每圈螺旋需要3.6个氨基酸残基,上升距离即螺距为0.54nm,每一个氨基酸残基绕螺旋轴上升0.15nm。在α-螺旋结构中,肽链骨架的每个(第n个残基)与它后面C端方向的第四个残基(n+4)的Nα—H形成氢键,螺旋内的氢键近乎平行于中心轴,骨架的羰基都指向C末端。α-螺旋内氢键的总体效应是稳定螺旋构象的力量。

图2.37 蛋白质的α-螺旋结构

α-螺旋内肽键之间形成的氢键是稳定螺旋构象的主要作用力,而肽链中氨基酸残基侧链也影响α-螺旋的稳定:①连续出现的氨基酸残基侧链的带电基团存在静电排斥或吸引作用。②相邻氨基酸侧链的空间位阻。③相隔3个(有时是4个)氨基酸残基侧链之间的静电作用(如酸性或碱性氨基酸)和疏水相互作用(如芳香族氨基酸)等。④脯氨酸和甘氨酸残基的存在,甘氨酸侧链只有一个氢原子,它绕α-碳的旋转自由度较大,较其他氨基酸残基具有更高的构象柔性,使α-螺旋不稳定,因此许多α-螺旋开始或终止于甘氨酸。脯氨酸残基基本上不会出现在α-螺旋中,主要是因为其刚性环状的侧链占据了相邻残基的空间,其不能旋转的N—Cα造成右手螺旋构象的瓦解或弯曲;另一个原因是脯氨酸的酰胺氮上缺少氢原子,使得脯氨酸残基不能参与α-螺旋的氢键形成,因此脯氨酸经常出现在α-螺旋的末端。⑤α-螺旋片段两端的同质性,肽链中的羧基氧带部分负电,氨基带部分正电,每个肽键都存在小的电偶,这些电偶通过螺旋中的氢键连接,形成伸展的净电偶(图2.38)。在α-螺旋的N端或C端有4个氨基酸残基不完全参与形成螺旋的氢键,所以在螺旋的N端形成局部正电,在C端形成局部负电。通常侧链带负电的氨基酸残基常出现在螺旋的氨基端附近,与螺旋偶极所带的正电荷产生一个稳定的相互作用,而带正电荷的氨基酸在氨基末端是不稳定的。同理,带正电荷的氨基酸残基可稳定螺旋片段的羧基端。总之,α-螺旋的稳定趋势由片段中氨基酸残基的性质及序列决定。

图2.38 肽链的电偶

α-角蛋白(α-keratin):哺乳动物的毛发、角、指甲以及皮肤中主要蛋白质是α-角蛋白。毛发α-角蛋白螺旋是一种右手α-螺旋,方向一致的两条肽链相互缠绕形成左手超螺旋。两个α-螺旋的接触部分多由疏水氨基酸组成,侧链基团之间相互契合形成规则的互锁形式,使得左手超螺旋中多肽链间近距离堆积。多个超螺旋组成更加高度有序的原纤维(protofibril),许多原纤维再组装成超分子复合物——中间纤维(intermediate filament)(图2.39)。原纤维和中间纤维都是通过二硫键的形成而使相邻的肽链相互交联,增加整体结构的稳定性。

图2.39 毛发横切面和毛发的α-角蛋白结构

α-角蛋白含有丰富的半胱氨酸残基,根据半胱氨酸的含量,分为硬角蛋白和软角蛋白两类。硬角蛋白富含二硫键,坚硬而且不易弯曲,如角、指甲、毛发等。而软角蛋白如皮肤、愈伤组织等含有少量二硫键,伸缩性比硬角蛋白好。

现实生活中的烫发就是毛发纤维间二硫键重构的过程。烫发时首先将头发卷成一定形状,用含有还原二硫键的药水(如硫醇)处理,使原来的二硫键断裂,形成还原型的—SH,然后用氧化剂药水处理,重新形成错位的新二硫键,导致头发弯曲成卷,在一段时期内保持波形。反之,卷发也可以经过同样的过程拉直。

胶原(collagen)也称为胶原蛋白,是许多动物体内组织(如骨、齿、腱、软骨)的基质以及眼角膜、皮肤和血管纤维等结缔组织的主要蛋白质成分。胶原螺旋具有独特的二级结构,明显不同于α-螺旋。天然胶原是由3条左手螺旋(α肽链,与α-螺旋不同)相互缠绕形成右手超螺旋的大分子(图2.40)。胶原分子中每一条左手螺旋与α-螺旋相比要伸展得多,每一圈螺旋需要3个氨基酸残基构成,螺距为0.94nm,每个氨基酸残基沿螺旋轴升高0.31nm。右手超螺旋的每一圈中每股左手螺旋包含30个氨基酸残基,螺距为8.6nm,直径为1.5nm。

图2.40 彩图

图2.40 胶原蛋白的结构

(a)一条左手螺旋(α肽链);(b)三条左手螺旋缠绕形成的右手超螺旋;(c)右手超螺旋分子的横切面,Gly位于螺旋中间(红色)

胶原中的必需氨基酸含量极少,所以其营养价值很低。胶原中含有35%的Gly、11%的Ala、21%的Pro和羟脯氨酸(HyPro),非标准氨基酸羟脯氨酸和5-羟赖氨酸(图2.41)约占10%,这些氨基酸是在胶原蛋白多肽链合成后由Pro或Lys在脯氨酰羟化酶或赖氨酰羟化酶催化下修饰而成。这种酶促修饰反应需要分子氧、抗坏血酸(维生素C)和α-酮戊二酸参与,其辅酶的辅助因子是Fe2+,因此缺乏维生素C会影响新胶原蛋白的合成,能引起血管和皮肤变脆。坏血病就是因为食物中缺少维生素C而导致的疾病。

图2.41 胶原中含有的非标准氨基酸

胶原蛋白多肽链中有很长区段是-Gly-X-Pro(HyPro)-的重复序列,Gly残基沿着右手超螺旋中心轴存在,因其侧链小,位置居中,适合三股螺旋的紧密结合;X是其他任意氨基酸残基;Pro和HyPro具有环形结构,其高含量可促使左手α肽链扭曲,形成螺旋状。胶原螺旋中不存在链内氢键,但超螺旋结构是靠链间氢键以及螺旋和超螺旋的反向盘绕维持其稳定性,其中每个Gly残基的N—H与相邻链X残基的形成氢键(图2.42),且HyPro残基的羟基也参与链间氢键的形成,使得三股螺旋更加稳定。

图2.42 胶原蛋白的链间氢键

胶原纤维是由胶原分子交错排列组成的超分子复合体,不同的复合体可以提供不同强度的张力。随着人的衰老,胶原纤维间的交联累积,导致结缔组织的硬度和脆度增大,当真皮层的胶原蛋白被氧化、断裂后,对表皮的支撑作用消失,造成不均一的塌陷,导致皱纹产生。

2)β-折叠

β-折叠(β-sheet)是另一种常见的蛋白质二级结构。在β-折叠结构中,氢键发生在相邻肽链之间,几乎垂直于延伸的多肽链。这些氢键可以连接两个或多个相邻肽链,也可以连接同一条肽链的不同片段。β-折叠分两类:平行式和反平行式(图2.43)。平行式β-折叠(parallel β-sheet)是指两条相邻肽链的方向一致,即肽链的N端都在同一边。反平行式β-折叠(antiparallel β-sheet)是指相邻两条肽链的方向相反,一条是从N端到C端,另一条则是由C端到N端。β-折叠中,多肽链上氨基酸残基侧链交替出现在折叠面的上面和下面,所以β-折叠也称为β-片层。蛋白质中多个片层相互排列靠近时,氨基酸残基侧链的影响相对较小,如甘氨酸、丙氨酸等常出现在β-折叠结构中。

图2.43 蛋白质的β-折叠结构

丝心蛋白(fibroin)是蚕丝和蜘蛛丝的主要成分,属于β-角蛋白,其二级结构主要是β-折叠,并且是反平行排列的β-折叠。大多数一级结构含有-Gly-Ser-Gly-Ala-Gly-Ala-的重复序列片段,甘氨酸残基侧链的氢原子都在折叠面的一侧,而丙氨酸残基或丝氨酸残基侧链的甲基或羟甲基都位于折叠面的另一侧,使得折叠片紧密地堆积在一起时,Gly侧链与Ser、Ala侧链接触层交替出现(图2.44)。这种结构的稳定性来自链间的大量氢键和范德华力相互作用,使得蚕丝所承受的张力并不直接放在多肽链的共价键上,因而具有很大的抗张强度。另外堆积的折叠片靠侧链间的范德华力结合,所以丝心蛋白具有柔软性。β-折叠是高度伸展结构,因此丝不能再承受拉伸。

图2.44 丝心蛋白的结构

天然的β-角蛋白除丝心蛋白外,还存在于鸟类和爬行类动物的羽毛、皮肤、爪、喙及鳞片中,这些蛋白质与丝心蛋白既有类似之处,也有不同之处。

3)β-转角

β-转角(β-turn)是在球蛋白中发现的一种二级结构,常在蛋白质表面出现。在球蛋白中,多肽链需要具有弯曲、回折和重新定向形成球状结构的能力,连接α-螺旋或β-折叠片段,这种结构有时也称为β-弯曲(β-bend)或发夹结构(hairpin structure)。多数β-转角涉及四个氨基酸残基,第一个氨基酸残基的—与第四个残基的—N—H形成唯一的氢键,构成一个紧密的环,使β-转角成为比较稳定的结构。图2.45给出了β-转角的两种主要类型,类型Ⅰ为普通转角,类型Ⅱ是第3个残基多为甘氨酸的转角。两种类型之间的差别是类型Ⅱ中第2位和第3位氨基酸残基的肽平面相对于类型Ⅰ翻转了180°。这两种转角中的第二位残基通常是Pro,Pro的刚性吡咯环提供了转折的机会。

图2.45 β-转角结构

4)无规卷曲

无规卷曲(random coil)又称自由回转,是指多肽链主链既非螺旋,又非折叠片或转角的没有一定规律的松散结构。肽链中肽键平面不规则排列,属于松散的无规卷曲。

2.4.3 超二级结构和结构域

1)超二级结构

超二级结构(supersecondary structure)是球蛋白分子中存在的、由若干个相邻的二级结构(主要是α-螺旋和β-折叠)彼此相互作用而组合成的、有规则的结构组合体,是多种蛋白质三级结构的构件。目前已知的超二级结构有3种形式:αα、βαβ和ββ(图2.46)。

图2.46 蛋白质中超二级结构的几种类型

αα:是一种α-螺旋束,通常由两条平行或反平行排列的右手螺旋相互缠绕形成的左手卷曲螺旋(coiled coil)或称超螺旋。在纤维蛋白(如α-角蛋白、肌球蛋白等)和球蛋白中都存在有卷曲螺旋。

βαβ:是由一条α-螺旋作为连接链将两条平行的β-折叠连接而形成的一种组合,两条β-折叠之间形成氢键;连接链的α-螺旋反平行地交叉在β-折叠片的一侧,β-折叠片的疏水侧链面向α-螺旋的疏水面,彼此紧密结合。最常见的βαβ组合是由3条平行β-折叠和2条α-螺旋构成,相当于两个βαβ组成,这种结构被称为Rossman折叠(βαβαβ)。

ββ:是由一条β-折叠链中的若干个片段反平行组合而成,片段之间通过β-转角连接,通过多个β-转角可形成更大更复杂的折叠片。

2)结构域

结构域(domain)是指存在于球状蛋白质分子中的相对独立的三维结构区域,是在二级结构或超二级结构基础上形成三级结构的局部折叠区,通常指具有特殊功能或意义的某个特定区域,如酶的催化部位或调控部位。对于较小的球状蛋白分子或亚基来说,结构域和三级结构是相同的,也就是说这些较小球蛋白或亚基是单结构域,如肌红蛋白。而较大的球蛋白或亚基,它们的三级结构大多是由两个或更多个结构域缔合而成,如弹性蛋白酶含有两个相似的结构域;木瓜蛋白酶含有两个不同的结构域;免疫球蛋白的每条轻链含有两个结构域等。

2.4.4 蛋白质的三级结构

蛋白质三级结构(tertiary structure)是指在二级结构基础上,一条多肽链在空间进一步盘绕、折叠形成的,包括主链和侧链构象(所有原子的排列)的特征三维结构,是一个充分折叠、具有生物学活性的完整的三维结构。三级结构的稳定依赖于非相邻氨基酸残基侧链的相互作用,包括氢键、疏水作用、离子键、二硫键和范德华力等。三级结构的形成使得一级结构中距离较远的氨基酸残基可以靠得很近,它们的侧链可以相互作用。在三级结构中肽链的弯曲位置、弯曲方向以及弯曲角度是由一些特定氨基酸残基决定的,如脯氨酸、甘氨酸、丝氨酸和苏氨酸等。肌红蛋白是第一个用X射线晶体衍射法确定的具有三级结构的蛋白质(图2.47)。

图2.47 肌红蛋白的三级结构

2.4.5 蛋白质的四级结构

蛋白质四级结构(quaternary structure)是指两条或两条以上多肽链在三级结构基础上,按一定的空间排列方式,通过非共价键缔合而形成的蛋白质分子结构。只有由两条或多条多肽链组成的蛋白质才有四级结构(图2.48),其中每一条肽链称为一个亚基(subunit),由两个亚基构成的称为二聚体蛋白。分类上有同源二聚体和异源二聚体之分,同源二聚体是由相同的两个单体或亚基构成,而异源二聚体是由两个不同亚基组成。由两个或两个以上亚基组成的蛋白质统称为寡聚蛋白质或多聚蛋白质。一般来说,纤维蛋白的特性通过它的二级结构就可以表现出来,但球蛋白的生物功能通常要以三级甚至四级结构才能表现出来。血红蛋白是一种典型的具有四级结构的蛋白质。

图2.48 蛋白质四级结构之间的关系

从蛋白质的高级结构来看,纤维蛋白常含有大量单一形式的二级结构,而球蛋白常含有多种二级结构,而这两类蛋白质在功能上也有所不同,纤维蛋白在生物体中常具有支持、连接和外部保护的功能,如α-角蛋白、丝心蛋白和胶原等;而生物体内的多数酶和调节蛋白都是球蛋白,如肌红蛋白、细胞色素c、溶菌酶以及核糖核酸酶等。

2.4.6 蛋白质折叠和结构预测

蛋白质的空间结构是由多肽链的一级结构即氨基酸残基序列决定的。多肽链在胞内核糖体上初生或刚刚合成、尚无生物功能前,需要在特定的胞内条件下经过折叠形成天然构象,这种自我组装的过程被称为蛋白质折叠(protein folding)。蛋白质分子只有处在特定的三维空间结构下,才能具有生物活性。蛋白质折叠的研究通常包括特定三维空间结构形成的规律、稳定性及其与生物活性的关系,既有热力学的问题,又有动力学的问题。折叠通常指细胞内自组装的过程,而蛋白质在体外的折叠过程通常称为复性。这里最根本的问题就是多肽链的一级结构到底是如何决定它的空间结构的?

20世纪60年代Anfinsen对变性蛋白质的复性过程所开展的经典实验表明,还原变性的牛胰核糖核酸酶(RNase)在不需要任何物质(除空气外)帮助下,仅除去变性剂和还原剂就可恢复天然结构,由此提出了“多肽链的氨基酸序列包含了形成其热力学上稳定的天然构象所必需的全部信息”的“自组装学说”,这一假说也得到了许多体外实验的证明。每一种蛋白质分子都具有自己特定的氨基酸组成和排列顺序,由这种氨基酸排列顺序决定其特定的空间结构。但生物体内蛋白质的折叠往往需要其他辅助因子参与,同时伴有ATP的水解。鉴于此,1987年Ellis提出了蛋白质折叠的“辅助性组装学说”,表明蛋白质的折叠不仅仅是一个热力学过程,也受到动力学的控制。

随着蛋白质折叠的深入研究,经典的蛋白质折叠“自组装学说”受到了挑战,越来越多的研究证实,“辅助性组装学说”更加符合体内蛋白质折叠的特点和途径,即蛋白质多肽链的正确折叠和组装需要其他蛋白质分子的帮助,如分子伴侣与折叠酶。

1)分子伴侣

分子伴侣(molecular chaperone)或分子伴娘是1978年Lasky在研究组蛋白和DNA组装成核小体时发现并命名的,这是一类能与部分折叠或不正确折叠的多肽相互作用的蛋白质,能够加速多肽链的正确折叠或提供折叠所需要的微环境。分子伴侣通常也是热休克蛋白(heat shock proteins,HSP),如HSP70蛋白质家族和陪伴蛋白。

2)折叠酶

蛋白质折叠过程中也需要酶的参与,这些酶可催化同分异构反应,如蛋白质二硫键异构酶(protein disulfide isomerase,PDI)催化蛋白质中二硫键的形成、交换或改组。肽链-脯氨酰顺反同分异构酶(peptide prolyl cis-trans isomerase,PPI)可催化Pro顺反异构体的相互转化,形成天然构象中的化学键。随着蛋白质折叠研究的深入,人们将会发现更多的加速蛋白质折叠的物质,同时也会发现更多疾病的发病原因。蛋白质的错误折叠会引起构象和功能发生变化,引发许多疾病,如疯牛病(BSE)、阿兹海默症(Alzheimer's disease,AD)、可传播性海绵状脑病(CJD)、肌萎缩性脊髓侧索硬化症(ALS)以及帕金森症(Parkinson's disease,PD)等,都是由于细胞内的一些重要蛋白质发生突变,导致蛋白质聚沉或错误折叠而造成的。外源基因在原核细胞中表达时常常出现不能正确表达的情况,这时错误折叠的蛋白质以包涵体(inclusion body)的形式出现在细胞内。

疯牛病是1985年在英国奶牛中首次被发现的,它是由一种朊病毒蛋白(prion protein,PrP)感染引起的神经系统退化,属于传染性海绵质脑病。朊病毒蛋白有两种形式:PrPc和PrPsc(图2.49)。PrPc无毒性,而其异构体PrPsc具有致病性;二者具有相同的一级结构,但空间构象不同,致病PrPsc是特定条件下发生错误折叠造成的、由良性变为具有传染性的蛋白质颗粒。目前由朊病毒引起的人类疾病已发现有4种:库鲁病(Kuru disease)、克-雅氏综合征(CJD)、格斯特曼综合征(GSS)以及致死性家庭性失眠症(FFI)。

朊病毒

图2.49 朊病毒蛋白结构变化

蛋白质的二级结构可通过氨基酸序列进行初步预测,在α-螺旋中出现频率较高的氨基酸有Leu、Ala、Met和Glu,而Pro和Gly的出现可以终止螺旋延伸,但常存在于β-转角中。Ala、Gly、Val、Ile和芳香族氨基酸在β-折叠中的频率较高,而Asp、Glu及Pro在β-折叠中含量却很低,因此肽链中的不同氨基酸残基会倾向于形成不同的二级结构。

从蛋白质分子一级序列预测三级结构,并进一步预测其功能,这是目前尚未很好解决的一个生物信息学问题。已有的研究表明,有些氨基酸序列相似的蛋白质的空间结构不同,但也有一些氨基酸序列不同的蛋白质的空间结构却相似。高级结构的形成可能与氨基酸序列相隔较远的残基侧链间的相互作用有关,因此三级结构预测的成功率很低,即使运用计算机模拟蛋白质折叠也不能得到完全与天然构象一致的预测结果。这就提出了一级结构和空间结构之间是否存在某种关系,是否也存在像核酸通过“三联体密码子”决定氨基酸顺序那样的一种密码?有科学家设想把这种密码称为“第二遗传密码子”。

目前蛋白质三维结构的确定主要靠实验手段,如X射线衍射法(X-ray diffraction)、核磁共振(nuclear magnetic resonance,NMR)等方法。前者需要蛋白质晶体,后者可用溶液。蛋白质晶体获取非常困难,而NMR法仅适用于寡肽,因此已知三维结构的蛋白质信息有限。计算机辅助模拟蛋白质结构尽管精度不高,但也广泛应用于药物设计领域。

2.4.7 蛋白质的序列同源性与进化关系

不同生物体中含有相同或相似功能的蛋白质,这些蛋白质被称为同源蛋白质(homologous proteins)。通过对同源蛋白质的一级结构比较,发现氨基酸序列具有明显的相似性,因此把具有明显序列相似性的蛋白质也称为同源蛋白质。同源蛋白质中一些特定位点的氨基酸残基相同,称为不变残基(invariant residue),其他位置上的氨基酸残基因物种不同而有较大差异,称为可变残基(variant residue)。

同源蛋白质一级结构之间的差异可以反映出物种进化关系,氨基酸残基序列差别越小,表明它们的亲缘关系越近。细胞色素c(cytochromec)是线粒体呼吸链中一种含有血红素的电子载体蛋白,是一条由104~112个氨基酸残基组成的多肽。通过分析来自不同物种细胞色素c的一级结构发现,肽链中有27个氨基酸残基在各物种中保持不变,可变残基在不同物种中有明显差别,可以看出各物种之间的进化关系(表2.3),如人与黑猩猩细胞色素c的氨基酸残基含量相同,表明亲缘关系较近;与其他哺乳动物的细胞色素c大约有10个残基的差异,与酵母菌或植物的差异在40个以上,说明亲缘关系较远。

表2.3 不同物种与人细胞色素c的氨基酸序列差异

通过同源蛋白质的氨基酸残基差异可以绘制出物种进化树。图2.50是根据细胞色素c绘制的进化树,进化树中每个树杈的长度都与可变氨基酸残基数成比例,显示在进化过程中各个物种的起源和出现的时间顺序,分支点表示分化来自于同一个祖先,数字表示该物种与其祖先细胞色素c中氨基酸的差异数目。

图2.50 细胞色素c的进化树