第五节 生物质谱技术与蛋白质鉴定 Section 5 Biological Mass Spectrometry and Protein Identification

质谱测定分析是蛋白质组学研究的核心关键技术,是蛋白质组学研究中的重要工具,具有高灵敏度、高准确度、自动化等特点。过去10年中,质谱技术的发展,特别是基质辅助激光解吸附电离飞行时间质谱(MALDI-TOF)和电喷雾质谱(electrospray ionization mass spectrometry,ESI-MS)给蛋白质的鉴定技术带来革命性的变化,已成为蛋白质组研究中最重要的、使用最广泛的手段,极大地推动了蛋白质分离与鉴定的发展,在生命科学领域得到了广泛应用。
一、质谱的一般原理与分类
质谱(mass spectrometry,MS)是物质组成的一种展开方式。首先使混合物或单体形成离子,然后利用离子在电磁场中的运动性质,把离子按质荷比( m/ e)分开。离子按质荷比大小排列的谱称为质谱。通过对样品离子的质荷比及其强度的测定可进行物质的成分和结构分析。一般的质谱仪由离子源、质量分析器和离子检测组成。由于质谱仪产生和利用气相离子,一般需要在高真空系统下操作。样品通过进样系统进入离子源,在离子源中,样品分子或原子被电离成离子,经过质量分析器,即可按荷质比分开,再经检测、记录,即得到样品的质谱图。根据质谱峰的位置进行定性分析,质谱峰的强度表征该种离子量的多少,据此进行定量分析。
生物质谱的关键是将非挥发性的生物大分子转化为气相中离子化的分子,所涉及的解吸/离子化技术涉及不同的物理方法(表7-1)。
表7-1 几种生物质谱方法和原理
质谱按分析器类型不同可分为傅里叶变换质谱、离子阱质谱、磁转换质谱、四级杆质谱和飞行时间质谱等。在分析不同类型的化合物中,各种质谱均有自己的特点。这里主要介绍基质辅助激光解吸附电离飞行时间质谱(MALDI-TOF)和电喷雾质谱(ESI-MS/MS)。
(一)基质辅助激光解吸电离飞行时间质谱
在质谱分析中,为了测定待测物分子的质量,首先必须在系统中导入能量。能量的导入必须满足以下两点要求:第一,能量能有效并受控制地转换到样品中使样品分子充分地解吸附并离子化;第二,为避免热不稳定性物质的热降解,能量必须在非常短的时间内导入。较理想的能量导入方式是激光具有脉冲短、灵敏度高的特点。
在基质辅助激光解吸电离技术中,采用一种小分子物质即基质帮助大分子物质进入气相。当基质以较高的比例与样品混合后,高分子待测样品便以单分子状态均匀地分散于基质中。在所采用的激光波长下,由于基质对激光有较强的吸收,而待测物只吸收很弱的激光,故不会造成大分子物质的破坏和降解。当大量被激发的基质分子由于热释放而挥发时,会同时将非挥发性的大分子待测物质带入气相。基质的加入使得除待测物基质以外的分子之间的相互作用减少,因而降低解吸能,解决大分子物质的气化问题。
基质在MALDI-TOF-MS方法的作用主要包括三个方面:第一,从激光光源吸收能量以防止被测大分子物质分解;第二,使被测物分子分离成单分子状态以防止它们聚集;第三,在被测物离子化过程中充当质子化试剂。第一条作用要求基质对激光光源有很强的吸收,到目前为止文献报道的基质化合物均为含苯环的有机化合物;第二条作用要求基质与被测物质具有很好的相容性,同时不能有分子间的相互作用;第三条作用要求基质为酸性物质。
MALDI-TOF可用于测定蛋白质或多肽的精确分子量以及测定较大分子的分子量。基质从激光吸收能量并转移为固定系统的激发能量,生物大分子存在于大量基质分子中,因此,生物大分子间相互作用力被降低,易于获得能量气化并离子化。气化后的离子通过测定飞行时间来得到其 m/ z,飞行时间一般为几微秒至100微秒,加速电压为1~30kV,飞行距离一般为0.5~3m,在线性TOF中,其质量分辨率在1.2m时为4000,在反射6.4m TOF中其质量分辨率可达10 000~15 000。对分子量达30kDa蛋白质其质量测定精确度达0.01%,如 m/ z 为29,025Da碳酸酐可达到0.5Da质量精确度,典型分析物需要1pmol浓度,使用表面制备技术可测定1~10fmol蛋白质,测定分子量可达300kD。
某些型号MALDI-TOF质谱仪配备有源后衰变(post source decay,PSD)的硬件和软件,能够实现MS/MS功能使某些多肽离子产生低能碎片离子。根据这些碎片离子的分析,可以溯源碎片离子的氨基酸序列。
(二)电喷雾质谱
电喷雾电离是利用强静电场从溶液直接产生气态离子化分子的一种方法。其基本原理是在一个金属喷嘴的尖端施加约4000V高电压,所产生的高电场使喷出的样品溶液雾化成细小的带电液滴。在向质量分析器移动的过程中,干燥气和加热的作用使液滴的溶剂不断蒸发,体积不断缩小,而液滴表面的电场强度则逐渐增大。当液滴表面同种电荷的相互排斥力超过表面张力时,液滴就发生裂分。经过连续不断的溶剂蒸发-液滴裂分过程,高度带电的液滴最后产生大量带一个或多个电荷的离子,进入质量分析器进行质谱分析。因此电喷雾又称离子喷雾。
电喷雾质谱的主要特点为:①质量检测范围宽:电喷雾电离时往往产生多电荷分子离子,测定大分子物质分子质量时使质荷比( m/ z)降低至多数质量分析器都可以检测的范围。这样,用检测范围为1000~2400 m/ z的ESI质谱可以测定分子质量为数百万道尔顿的蛋白质。而分子离子的真实分子质量可以根据其 m/ z值及所带的电荷数准确计算出来。②灵敏度高:一般可以在10 -15~10 -12 mol水平上准确分析分子质量高达几万至几十万的生物大分子。纳喷雾(nanospray)比常规电喷雾的电离效率和灵敏度更高。③精确度高:ESI质谱测定分子质量时的精度高于其他方法,一般可达±0.01%。一方面,是因为它本身的分辨率高,图谱中的同位素峰分布清晰可辨;另一方面,是其测出的分子质量是多个多电荷离子计算出的分子质量数值的平均值。④干扰少。因为不需要特定基质,所以在质谱解析中避免基质峰的干扰。⑤适用于结构分析:将ESI技术与碰撞诱导裂解等过程相结合进行串联质谱分析,可分析蛋白质和多肽等物质的一级结构和共价修饰位点等。此外,ESI软电离特点可以使得蛋白质等大分子化合物不被破坏而完整地在质谱中得到检测,从而可以获得生物大分子的构象及非共价相互作用的化学信息。⑥适合于色谱-质谱联用:可将ESI质谱仪与低流速液相色谱和毛细管电泳等联用,直接分析流出液中样品成分的分子质量和化学结构,不仅可以提高检测灵敏度,而且可以“间接”分析混合物。
电喷雾局限性主要表现在样品中的盐类耐受性较差。直接进样时,样品要事先经过脱盐,否则仪器的灵敏度明显下降。此外,由于单种分子因带电荷情况不同会形成多种分子离子峰,因而对混合物的图谱解析比较困难。
二、蛋白质组学网上资源与数据库检索
随着双向电泳及质谱测定方法及仪器的发展,越来越多的蛋白质混合物经过双向电泳分离和质谱鉴定,产生相应的数据越来越多。为了确定已知蛋白质是否为未知新的蛋白质,通过数据库的检索比较是非常必需的,因而蛋白质数据的建立对生物科学家或蛋白质化学家而言均是非常有用的。
在因特网上有一系列的生物信息学工具,适用于对不同类型的实验获得的数据对蛋白质进行鉴定和表征。最常见的是日内瓦大学ExPASY服务器,相应亦有其他较多类似的蛋白质鉴定和表征程序,如protein prospector(旧金山大学质谱中心)、PROWL site(纽约大学洛克费勒MS组)以及peptide search(EMBL蛋白质与多肽研究小组)等。
由于蛋白质组学研究依赖生物信息学和网络技术,网络上有关蛋白质组研究的技术支持以及蛋白质数据分析的专家系统、数据库等专门网站很多,包括各种蛋白质研究相关的信息、从新药开发角度发现新蛋白及新作用、蛋白质研究相关企业、蛋白质质谱数据库检索、介绍蛋白质鉴定的先进仪器、蛋白质鉴定专家系统、蛋白质相互作用分析等。
三、其他研究方法
除上述双向电泳分离方法外还发展了许多其他分离方法,如多维液相色谱、毛细管电泳、双向液相电泳等技术,虽然其分离能力不如2-D电泳,但具备能在液相分离、保持原蛋白质活性及结构、可大量制备等优点。此外,在蛋白质筛选与鉴定方面亦出现使用抗体方法,以感兴趣的多肽或蛋白质作为探针分离特定的抗体。酵母双杂交技术是另一种研究蛋白质-蛋白质相互作用的方法,可发现新的突变体及其作用。另外与DNA芯片相比拟的是蛋白质芯片技术,利用从原始样品亲和吸附蛋白质进行分离,以表面增强激光解吸/电离技术进行鉴定,可高速进行活性蛋白质组分析。
四、展望
蛋白质是基因组中编码的最重要的功能成分,后基因组时代蛋白质分析最重要的是能够对蛋白质复杂混合物进行大规模分析。蛋白质组学经近几年的努力在分离方法及鉴定技术等方面取得很大的进展,利用其高分辨能力及质谱鉴定能力已对许多疾病中异常表达蛋白质成分进行鉴定,在农作物品种鉴定、新药开发、微生物等领域也取得了广泛的应用。但是,目前蛋白质组学尚存在明显的不足,具体表现在对整体蛋白质的分辨能力及鉴定能力有待进一步提高;对疏水性强、分子量较小或较大蛋白质、极端强碱性蛋白质以及分离后胶上蛋白质的回收等均有待较大改进与提高;如何克服大量操作而能够进行自动化快速分析,仍是蛋白质组学研究存在的困难。随着仪器的改进与研究方法的发展,蛋白质组学将对现代化生物学及生物技术的发展做出重大贡献。
同时,蛋白质组学研究的整理思路和方法将对生物学中的一些重要问题的解决起到作用。从蛋白质组学研究的趋势来看,寻找机体病理生理过程中出现的差异表达的蛋白质,揭示蛋白质之间的相互作用关系,揭示蛋白质组复杂结构与功能之间的关系,是蛋白质组学研究的热点。
当然蛋白质组学为一个新兴学科,目前还处于初期发展阶段,仍有许多困难有待克服。如双向电泳和质谱分析的灵敏度还很难将体内微量的调节蛋白质精确分析,而这种微调控蛋白的精确表达在生命过程中起到关键性作用。另外,质谱分析仪的价格十分昂贵,约为DNA序列分析仪的十倍之多,严重影响其普及和广泛应用。再者,成千上万种蛋白质间及蛋白质与其他生物大分子间的相互作用和作用方式的复杂性同样也是蛋白质组研究所面临的问题。但是蛋白质组学的研究前景的确相当广阔,国际上每年在蛋白质组研究中投入的资金和力量成倍增加,美国国立卫生研究院(NIH)的国立肿瘤研究所(NCI)投入一千万美元经费研究肿瘤相关的蛋白质组,法国、英国、德国、日本都有类似的计划支持蛋白质组学研究,澳大利亚政府已于1998年成立了一个澳大利亚蛋白质组分析协会(Australian Proteome Analysis Facility,APAF),专门为蛋白质组研究提供资金、技术、设备、培训等服务支持。我国蛋白质组学研究也已经开始启动。蛋白质组学研究受到国家自然科学基金的大力资助。国内多个单位都从不同的方向开始蛋白质组学研究,相信在政府和各研究单位的努力下,我国蛋白质组学的研究在不久的将来一定会取得具有重要意义的、具有国际水平的成果。