第二节 尿液生物化学的重要内容

一、尿液的组成

加拿大艾伯塔大学戴维•威舍特研究小组共发现了3079种化学物质,包括了蛋白质、核酸以及体内代谢的最终产物等。戴维•威舍特教授指出:“尿液是一种极其复杂的生物流体。我们没想到会有这么多种不同的化学物质进入尿液。”他说,目前多数尿检只检测六七种化学成分,多数医学教科书也仅列出尿液中的50~100种化学成分,而这项研究则将名单扩充了30倍。研究人员表示,这一成果将使利用尿液而非血液或组织切片的新一代医学检测技术成为可能,从而让检测成本下降,耗时变短。现在,针对结肠癌、前列腺癌、腹腔疾病、溃疡性结肠炎、肺炎与器官移植排斥等新一代尿液诊断技术已进入开发过程或即将进入医院。
从这个分析来看,尿液的组成除水及无机盐之外,主要还包括蛋白质、酶等有机物质,核酸及多种有生物学活性的小分子化合物,如维生素、激素、氨基酸及其衍生物、肽、核苷酸等。若从分子种类来看,那就更复杂了。以蛋白质为例,人体内的蛋白质分子,据估计不下100 000种。这些蛋白质分子中,极少与其他生物体内的相同。每一类生物都各有其一套特有的蛋白质;它们都是些大而复杂的分子。其他大而复杂的分子,还有核酸、糖类、脂类等;它们的分子种类虽然不如蛋白质多,但也是相当可观的。这些大而复杂的分子称为“生物分子”,经过人体新陈代谢或疾病状态时的丢失或消耗,汇聚在尿液中。生物体不仅由各种生物分子组成,也由各种各样有生物学活性的小分子所组成,足见生物体在组成上的多样性和复杂性。
大而复杂的生物分子在体内也可降解到非常简单的程度。当生物分子被水解时,即可发现构成它们的基本单位,如蛋白质中的氨基酸,核酸中的核苷酸,脂类中脂肪酸及糖类中的单糖等。这些小而简单的分子可以看作生物分子的构件,或称作“构件分子”,亦可存在于尿液之中,与大分子物质共存。它们的种类为数不多,在每一种生物体内基本上都是一样的。实际上,生物体内的生物分子仅仅是由几种构件分子,如氨基酸、核苷酸、脂肪酸和单糖,借共价键连接而成的。组成一个生物分子的构件分子的数目多,它的分子就大;因为构件分子不止一种,而且其排列顺序又可以是各种各样,由此而形成的生物分子的结构,当然就复杂。不仅如此,某些生物分子在不同情况下,还会具有不同的立体结构。构件分子在生物体内的新陈代谢中,按一定的组织规律,互相连接,依次逐步形成生物分子、亚细胞结构、细胞组织或器官,最后在神经及体液的沟通和联系下,形成一个有生命的整体。

二、尿液的代谢与调控

新陈代谢由合成代谢和分解代谢组成,前者是生物体从环境中取得物质,转化为体内新的物质的过程,也叫同化作用,后者是生物体内的原有物质转化为环境中的物质,也叫异化作用。同化和异化的过程都由一系列中间步骤组成。中间代谢就是研究其中的化学途径的。如糖原、脂肪和蛋白质的异化是各自通过不同的途径分解成葡萄糖、脂肪酸和氨基酸,然后再氧化生成乙酰辅酶A,进入三羧酸循环,最后生成二氧化碳。新陈代谢是在生物体的调节控制之下有条不紊地进行的。这种调控有3种途径:①通过代谢物的诱导或阻遏作用控制酶的合成。这是在转录水平的调控,如乳糖诱导乳糖操纵子合成有关的酶;②通过激素与靶细胞的作用,引发一系列生化过程,如环腺苷酸激活的蛋白激酶通过磷酰化反应对糖代谢的调控;③效应物通过别构效应直接影响酶的活性,如终点产物对代谢途径第一个酶的反馈抑制。生物体内绝大多数调节过程是通过别构效应实现的。
尿液代谢是关于定量描述生物内源性代谢物质的整体及其对内因和外因变化应答规律的研究。其中心任务包括:①对内源性代谢物质的整体及其动态变化规律进行检测,量化和编录;②确定此变化规律和生物过程的有机联系。就细胞系统而言,不仅存在细胞自身的代谢物质组成问题,存在细胞之间代谢物质交换的问题,也存在代谢过程所发生的位点问题。因此,简单地分析代谢物质的总组成(即代谢组)缺乏“整体论”所要求的全面性,其意义有一定局限。研究代谢产物谱变化的代谢组学可提供生物过程中的完整信息。
代谢组学属于全局系统生物学研究方法,便于对复杂体系的整体进行认识。系统生物学研究就是要将给定生物系统的基因、转录、蛋白质和代谢水平所发生的事件、相关性及其对所涉及生物过程的意义进行整体性认识。我们已经发现,脱氧核糖核苷酸(deoxyribonucleic,DNA)、信使核糖核酸(message ribonucleic acid,mRNA)等核酸分子及蛋白质的存在为生物过程的发生提供了物质基础(但这个过程有可能不发生),而尿液代谢物质所反映的是已经发生了的生物学事件。因此研究尿液的代谢是对一个生物系统进行全面认识的不可缺少的一部分,是全局系统生物学的重要基础,也是系统生物学的一个重要组成部分。
例如,一个正常工作的人体包括“人体”本身和与之共同进化而来且共生的消化道微生物群体(或称菌群),孤立地研究“人体”本身的基因,转录子以及蛋白质当然可以为人们认识人体生物学提供重要信息,但无法提供使人体正常工作不可缺少的菌群的信息。人体尿液的代谢组却携带着包括菌群在内的每一个细胞的信息,因此代谢组学方法对研究如人体这样复杂的进化杂合体十分有效。正因如此,尿液代谢组学已经广泛地应用到了包括药物研发,分子生理学,分子病理学,基因功能组学,营养学,环境科学等重要领域。

三、尿液生物大分子的结构与功能

生物大分子的多种多样功能与它们特定的结构有密切关系。蛋白质的主要功能有催化、运输和贮存、机械支持、运动、免疫防护、接受和传递信息、调节代谢和基因表达等。由于结构分析技术的进展,使人们能在分子水平上深入研究它们的各种功能。酶的催化原理的研究是这方面突出的例子。蛋白质分子的结构分4个层次,其中二级和三级结构间还可有超二级结构,三、四级结构之间可有结构域。结构域是个较紧密的具有特殊功能的区域,连接各结构域之间的肽链有一定的活动余地,允许各结构域之间有某种程度的相对运动。蛋白质的侧链更是无时无刻不在快速运动之中。蛋白质分子内部的运动性是它们执行各种功能的重要基础。80年代初出现的蛋白质工程,通过改变蛋白质的结构基因,获得在指定部位经过改造的蛋白质分子。这一技术不仅为研究蛋白质的结构与功能的关系提供了新的途径;而且也开辟了按一定要求合成具有特定功能的、新的蛋白质的广阔前景。基因本体论(gene ontology,GO)分析尿液蛋白质参与生物学过程主要包括调控炎症反应、免疫反应、外泌体的形成、氧化-还原代谢反应、凋亡细胞的清除等功能(图1-1)。
图1-1 GO分析尿液蛋白质组学参与的生物学过程
核酸的结构与功能的研究为阐明基因的本质,了解生物体遗传信息的流动做出了贡献。碱基配对是核酸分子相互作用的主要形式,这是核酸作为信息分子的结构基础。脱氧核糖核酸的双螺旋结构有不同的构象,J.D.沃森和F.H.C.克里克发现的是B-结构的右手螺旋,后来又发现了称为Z-结构的左手螺旋。DNA还有超螺旋结构。这些不同的构象均有其功能上的意义。核糖核酸(ribonucleic acid,RNA)包括mRNA、转移核糖核酸(transfer RNA,tRNA)和核糖体核糖核酸(ribosomal RNA,rRNA),它们在蛋白质生物合成中起着重要作用。新近发现个别的RNA有酶的功能。
图1-2 ExoCarta database数据库中已经发现的外泌体
基因表达的调节控制是分子遗传学研究的一个中心问题,也是核酸的结构与功能研究的一个重要内容。人体内估计超过1/3的细胞转录组受微RNA(micro RNA,miRNA)调节,虽然数目相对不多(少于2000种),但在常见的组织和体液中miRNA有很高的稳定性,miRNA表达增殖的潜力可准确辅助定量分析与分散的组织类型和疾病状态有定位关系的miRNA,从而作为一个诊断新工具。有研究认为外泌体是转运miRNA的细胞结构基础,外泌体是纳米级别的细胞单层膜结构,可由机体多种类型细胞释放,并广泛分布于尿液、唾液、血浆、乳汁等体液中(图1-2)。外泌体可携带多种mRNA、miRNA、蛋白质,参与细胞间通信,重启免疫系统,血管新生、肿瘤细胞生长等过程。在肿瘤等疾病中,这些分子都可以作为生物标志物。miRNA也是重要的调节分子,涉及细胞生长全过程,如时序发育、干细胞分化和凋亡,可作为一种“肿瘤信号”。研究显示miRNA在病理发展中会快速从组织中释放入血,在血清、血浆、唾液和尿液中,这些胞外miRNA与肿瘤的不同病理状态有关。

四、尿液中的“组学”

(一)尿液蛋白质组学
最新数据的人类尿蛋白质组数据库(human urinary database)收录了13 020个尿液样品。其中发现的人的生物标记物涉及的疾病主要有移植相关疾病(造血干细胞移植、肾移植、肝移植等),泌尿系统疾病(膀胱输尿管逆流、输尿管连接部梗阻、肾脏疾病、膜性肾小球肾炎、肾结石、IgA肾病、局灶性节段性肾小球硬化症、糖尿病肾病、多囊肾病、急性肾损伤、范可尼综合征、微小病变性肾病等),生殖系统疾病(良性前列腺增生症、先兆子痫、多囊卵巢综合征等),脑血管疾病(脉管炎、血栓形成、高血压、心力衰竭、1型与2型糖尿病、冠状动脉疾病等),肿瘤(嗜铬细胞瘤、卡波西肉瘤、膀胱癌、肾癌、前列腺上皮内瘤变、前列腺癌、法布里病、动脉瘤、结肠癌、肺癌、卵巢癌等),免疫性疾病(系统性红斑狼疮、人类免疫缺陷病毒、过敏性紫癜等),神经系统疾病以及其他一些疾病(肺炎、丙型肝炎、胆道闭锁、阿尔茨海默病、目盲)等。在这些疾病中,每一种疾病相关的蛋白标记物少则几种,多则一千多种,而这些标记物并不特异性的代表某一种疾病。有研究者从肾移植慢性移植肾功能障碍的18个生物标记物中筛选出了一种诊断肾移植慢性移植肾功能障碍的蛋白,它的敏感性和特异性也只有93%和65%。
目前,国内外关于病理情况下尿液中蛋白质的数据已经非常丰富,但由于个体间以及个体内存在差异;早期小样本试验须经过大样本的验证才能确定;再者由于试验条件所限,单个研究机构研究的样本数和疾病种类都比较有限,很难解决生理和疾病相关标志物的可信度和特异性的问题,因此需要建立数据共享平台。如上面提及的人类尿蛋白质组数据库,还有尿液蛋白质生物标记物数据库(urinary protein biomarker database),它是基于PubMed数据库公布的可以用于标记疾病的蛋白质建立的,其中涉及到人类的10种癌症,31种泌尿外科疾病和15种非泌尿道疾病;涉及动物的21种泌尿道疾病和4种非泌尿道疾病。再有尿液外核体蛋白质数据库(urinary exosome protein database),它是基于肾脏与电解质代谢实验室(laboratory of kidney and electrolyte metabolism,NHLBI)用两种质谱方法鉴定的外核体蛋白质而建立的,其中包括了1600种蛋白质。这些数据库的建立不仅可以解决数据的可靠性的问题,通过数据的比较还可以确定某种疾病的特异性蛋白。
(二)尿液代谢组学
目前,代谢组学被认为是系统生物学的一个重要学科之一,严格地说,代谢组学是指某一生物体或细胞所有的代谢产物与基因组学、转录组学和蛋白质组学相对应,代谢组学是一门通过对某一生物或细胞所有低相对分子质量的代谢产物进行定性和定量分析,并用以监测活细胞中化学变化的学科。其研究对象为体内所有分子量小于1kD的小分子代谢产物。著名学者German等曾在文章中写道:“基因组学反映了什么是可以发生的,转录组学反映的是将要发生的,蛋白质组学指出了什么是赖以发生的,只有代谢组学才真正反映已经发生的。”
常用代谢组学分析的生物分析技术包括光谱方法,如核磁共振(nuclear magnetic resonance,NMR)、液相色谱(liquid chromatography,LC)、气相色谱(gas chromatogram,GC)、毛细管电泳(capillary electrophoresis,CE)和质谱(mass spectrum,MS)联用的技术。其中NMR和MS是目前最常见的两种检测技术。应用生物分析技术获得原始数据后,需要对其进行分析,其一般模式识别方法主要包括主成分分析(principal component analysis,PCA)、聚类分析(cluster analysis,CA)、偏最小二乘法(partial least square method,PLSM)、偏最小二乘法-显著分析(PLS-DA)等。