第二节 丙型肝炎病毒分子病毒学

一、丙型肝炎病毒基因组结构

HCV属黄病毒属,因此对HCV各种裂解蛋白的推测是以黄病毒的编码区为依据的。HCV基因组是一单股正链RNA,全长约9 600nt。推测基因组的排列为:5'-NCR-C-E1-E2-p7-NS2-NS3-NS4A-NS4B-NS5A-NS5B-3'-NCR,编码区占基因组全长的95%。仅含有单一的ORF,从第4个ATG起始合成蛋白,编码一个3010~3033aa的多聚蛋白前体,然后在宿主信号肽酶及HCV NS3丝氨酸蛋白水解酶的作用下,裂解成各种病毒蛋白,其中C蛋白、E蛋白为结构蛋白,NS2~NS5为非结构蛋白,P7蛋白的功能尚不清楚。

二、丙型肝炎病毒基因组主要功能区

(一)5'端非编码区

HCV基因组的5'端有一段NCR,长342bp。5'-NCR形成广泛的二级结构。对不同分离株及基因型的HCV基因组序列的分析结果表明,5'端非编码区(5'-noncoding region,5'-NCR)是整个基因组中最为保守的区段,因此可作为HCV的PCR诊断标志。5'-NCR为翻译的起始所必需,在大多数的基因型HCV,5'-NCR内都有5个起始密码子(AUG)。翻译的启动机制是内部核糖体进入:核糖体与基因组的内侧结合,从特定位点的AUG起始密码子启动翻译。有多种细胞因子参与这一过程。HCV的内部核糖体进入位点(internal ribosome entry sites,IRES)的3'边界不在5'-NCR内,而在病毒编码衣壳蛋白的序列内,它至少包括了衣壳蛋白的29个核苷酸。5'-NCR延伸入编码区的区段可能形成一个稳定的二级结构。如果将AUG突变为AUU或CUG,对翻译的抑制作用很小。在342bp处起始密码子前后再分别插入一个AUG,对于核糖体的正确识别并无影响,说明核糖体的识别是很特异的。缺失突变结果表明,5'-NCR中nt46所形成的茎环对IRES至关重要。

(二)核心蛋白

核心基因位于HCV基因组N端,紧接5'-NCR,全长573nt,编码191aa。该区段较为保守,对7种不同基因型的序列分析发现,核心区基因的核苷酸同源性和由此推导出的氨基酸序列同源性分别为79.4%~99.0%和85.3%~100%,其保守性在HCV基因组中仅次于5'-NCR。

核心蛋白具有典型的黄病毒科核心蛋白的特性,如富含碱性氨基酸、亲水性高、抗原性强、不含糖基化位点。核心蛋白中脯氨酸(Pro)的含量约占11.0%,高含量的Pro可能与维持蛋白质的结构有关。而精氨酸(Arg)、赖氨酸(Lys)含量高达15%,主要分布在aa6~23、aa39~74和aa101~121这3个保守的亲水区段内。这3个区段同时也是蛋白的免疫优势区,其中aa39~62的10个Arg、Lys残基完全不变,可能是一个重要的RNA结合域。核心蛋白的C末端则带有两个疏水区段,分别位于aa121~151和aa170~191,后者被认为是HCV E1蛋白的跨膜信号序列,对核心蛋白本身的亚细胞定位也有重要作用。序列分析发现核心蛋白aa99~102可能是一个DNA结合基序SPRG。缺失突变证实aa38~43的PRRGPR是核定位信号。此外,蛋白激酶A、C的识别位点也已确定,分别是Ser53、Ser116和Ser53、Ser99。

核心蛋白是HCV的核壳蛋白,它具有自身多聚化和结合病毒RNA的能力。此外,近年来研究发现HCV核心蛋白是一种多功能蛋白质。除作为结构蛋白具有病毒颗粒组装功能外,它还具有调控细胞及病毒基因表达、调控细胞正常生长等功能。它能调控很多基因的转录,如p53等肿瘤相关基因、一些细胞周期相关基因以及细胞凋亡相关基因。HCV核心蛋白对 I-κB 降解的调控、对 c-Jun激酶(c-Jun N-terminal kinase,JNK)活性的调控则间接地抑制了很多重要基因的转录。研究还发现HCV核心蛋白和转录调节因子异质性胞核核糖核蛋白 K(heterogeneous nuclear ribonucleoprotein K,hnRNP K)之间有蛋白 -蛋白相互作用,结合hnRNP K的位点定位于第25~91氨基酸。核心蛋白对转录的调控可能与HCV致病机制有关(如肝癌)。此外,通过对一些重要细胞基因进行转录调控,HCV核心蛋白能抑制Fas和TNF-α介导的细胞凋亡,有利于病毒在细胞中建立持久感染,因而可能是丙型肝炎慢性化的机制之一。

(三)包膜蛋白

HCV包膜蛋白包括E1及E2(也称为E1/NS1),是完整的膜蛋白。E1基因位于HCV基因组中的 nt915~1490,长 576nt,编码蛋白长 192aa(aa192~383),表达产物为 gp35;E2 基因位于 nt1491~2768,长 1 278bp,编码蛋白长 426aa(aa384~809),表达产物为 gp70。E 区为HCV基因组中变异最大的部位,在不同的分离株中核苷酸差异可达30%左右。如美国HCV-1株与日本分离株HCV-J、HCV-BK及HC-J6的异源性分别为24.5%、25.2%及37.5%,其中E2区的差异分别为27.5%、28.9%及33.1%。E2 aa215~255区段中有一个中度变异区。在E2蛋白中,还有2个高度变异区(hypervariable region,HVR),分别为位于aa390~410 的 HVR1 及 aa474~480 的 HVR2。HVR1 包括 E2 N 末端的 32aa(aa383~414),极具多变性。在免疫系统的选择压力的作用下,HVR可发生快速突变,而在长达两年半的无丙种球蛋白的患者中并未见到变异。血清中针对HVR1的抗体,尽管在某一个体中具有较好的保护性,但因为它在各病毒株之间极具变异性,因此能否用于疫苗研究尚不明确。

(四)P7蛋白

P7是含有63aa的多肽(aa747~809),位于结构蛋白与非结构蛋白的连接处。P7是否被包装进入HCV颗粒尚未知晓。它由两个跨膜区域构成,形成六聚体离子通道。目前认为P7对于病毒组装是重要的,因为相关的牛病毒性腹泻病毒(BVDV)的相对应蛋白对产生有感染性的子代病毒是必需的,但对RNA复制却不是必需的。

(五)非结构蛋白

非结构蛋白由 NS2~NS5 组成,编码 NS2、NS3、NS4A、NS4B、NS5A 和 NS5B 6 种蛋白,其中NS3及NS5的功能较为明确。

NS2 区位于 nt2769~3359,长 591bp,编码蛋白长 197aa(aa810~1006),表达的蛋白质相对分子质量为23kD(p23)。NS2是一种穿膜蛋白,其C末端插入内质网腔,N末端位于胞质内。NS2的C末端和NS3的N末端紧密相连形成一个具有Zn2+依赖性金属蛋白酶的活性结构的复合体,负责NS2/NS3位点的剪切,在Zn2+的作用下,通过顺式作用快速自动裂解NS2/NS3位点。NS2/NS3剪切以后释放出游离的HCV NS3丝氨酸蛋白酶的N末端,对于病毒的复制是至关重要的。NS2/NS3蛋白酶的主要作用方式为自身催化,但在细胞培养系统中发现也存在反式剪切。

NS2/NS3裂解位点的上游130aa及下游180aa区段对NS2/NS3的转录是必需的,His952、Cys993、Glu972的突变将阻断或抑制NS2/NS3的裂解,提示该位点受病毒NS2/NS3区域编码的蛋白激酶所催化。

NS3 区位于 nt3360~5312,长 1 953bp,编码蛋白长 651aa(aa1007~1657),表达多功能蛋白p72(72kD)。蛋白的前1/3编码丝氨酸蛋白激酶,包含酶活性中心及底物结合部位,但其发挥作用需要NS4A及NS2作为协同因子、在二价金属离子的参与下完成,非结构蛋白的产生都与之相关。后2/3为NTPase/解螺旋酶编码序列,在RNA或DNA同源多聚体、poly(U)的作用下,该酶活性明显升高。通过poly(U)易与NTPase/解螺旋酶结合,推测NS3可与HCV 3'-NCR的poly(U)结合,但其具体意义还不清楚。

NS4 区位于 nt5313~6257,长 945bp,编码蛋白长 315aa(aa1658~1972),被 NS3 的蛋白酶裂解成 NS4A 及 NS4B 两部分,分别长为 54aa(aa1658~1711)及 261aa(aa1712~1972),分子量分别为8kD及27kD。NS4A有多种功能,如作为复制复合体的锚定物以及NS3丝氨酸蛋白酶的辅助因子。NS4A作为辅助因子既可以进行顺式剪切(NS3/NS4),也可进行反式剪切(NS4A/4B/5A/5B)。NS4A能显著提高NS3在胞质中的稳定性,并将之定位于内质网。NS4A辅助功能的活性区为aa1678~1691的14aa。用人工合成的该14氨基酸寡肽存在体外活性。NS4B是一个非常疏水的蛋白。它和NS3以及NS4A一起,为非结构蛋白NS5A的高度磷酸化所必需;NS5A要从p56形式转变为高度磷酸化的p58形式,要求NS3、NS4A、NS4B和NS5A被编码在一个多蛋白上。朝鲜学者证实,HCV NS4B蛋白与Ha-ras基因一起在HCV所致的细胞恶性转化中起重要作用。

NS5 区位于 nt6258~9374,长 3 117bp,编码蛋白长 1039aa,由 NS3 蛋白酶裂解成 NS5A(448aa,aa1973~2420)及 NS5B(591aa,aa2421~3011)两部分,主要表达 RNA 依赖的 RNA 聚合酶(RNA dependent RNA polymerase,RdRp),参与 HCV 的复制。NS5A 被发现和一个膜结合蛋白 hVAP-33(human vesicle-associated membrane protein-associated protein of 33 kD)有特异的结合,同时hVAP-33还和HCV的RdRp(NS5B)相结合。NS5A和NS5B分别和hVAP-33的羧端和氨端结合。此结合进一步提示NS5A是复制酶的组成部分并提示了复制酶在膜上定位的机制。

NS5A的两种形式p56和p58均为磷酸化蛋白,尤其后者为高度磷酸化蛋白。磷酸化暗示了此蛋白具有重要功能,比如在信号传导、转录调控、细胞凋亡等行为中起作用。NS5A具有多个脯氨酸富集区域,能和细胞信号分子的SH-3结构花式相结合,干扰细胞信号传导[(如对细胞外信号调节蛋白激酶(ERK)1/2磷酸化的抑制],这可能是HCV的致病机制之一。

根据和其他病毒的RNA依赖的RNA聚合酶(RdRp)顺序的同源性比较,HCV NS5B被指定为HCV的RdRp,即复制酶复合物最重要的成分,在真核体外表达系统表达产物大小为68kD,即p68。缺失突变分析表明NS5B的N末端负责结合RNA。单链RNA的复制过程要求RdRp具有引物酶活性或者在复制起始时它能利用某个特异的引物。体外试验表明NS5B能使用模板的3'末端羟基作为引物;而如果模板3'末端被封闭或者模板是一个单调的多聚核苷酸,NS5B起始复制时需要特定的寡聚核苷酸引物。这表明NS5B没有内在的引物酶活性。

(六)3'端非编码区

3'端非编码区(3'-noncoding region,3'-NCR)对HCV RNA结构稳定性的维持及病毒蛋白的翻译有重要功能,它包括以下4种元件:①一个短的约40nt的可变序列,其后有终止密码子;②一个多聚poly(U)序列,呈现高度异质性,即使是同一感染个体不同的HCV之间也存在这种异质性;③一个主要由U、少数C组成的多聚嘧啶序列;④一个新发现的98bp的多聚序列,称为3'-X尾,呈高度保守,即使是在遗传学差别最远的1B和2A之间也是保守的。其3'末端有一个46bp的新序列可形成稳定的茎环结构,可能对HCV负链RNA复制的起始很重要,无该序列的HCV基因组则无感染性。3'-NCR对HCV RNA结构稳定性的维持及病毒蛋白的翻译有重要功能。

(七)干扰素敏感决定区

近年来,特别是日本的一些研究,对IFN-α疗效不同患者的HCV的核苷酸序列进行比较,发现在IFN-α敏感和抗性HCV毒株之间在NS5A区存在着明显的差别。随而提出了 HCV NS5A 区具有 IFN-α 敏感决定区(interferon sensitivity determining region,ISDR)的概念。HCV基因型、血清HCV RNA水平以及肝组织病理改变程度等也是影响IFN-α疗效的主要因素。进一步研究表明,HCV NS5A aa2209~2248之间的序列性质和变异,对于HCV,特别是HCV 1b型的IFN-α治疗敏感性具有决定性的意义。ISDR氨基酸突变≥4aa的HCV称为突变型;≤3aa称为中间型;与标准株完全相同的称为野生型。对58例日本HCV感染者(包括15例肝硬化患者)的NS5A aa2209~2248序列的性质、血清丙氨酸转氨酶(谷丙转氨酶,alanine aminotransferase,ALT)和 HCV RNA 水平、年龄,以及组织病理学特征与IFN-α疗效之间的相互关系进行了研究。结果表明,NS5A的基因突变与IFN-α疗效敏感性之间具有显著的相关性,而且与血清HCV RNA水平以及组织病理学变化性质之间也有显著的相关性。在15例肝硬化患者中,6例NS5A突变的患者中3例有确切的病毒学指标表明对干扰素治疗有应答,但5例中间型和4例野生型HCV感染者,对于IFN-α的治疗没有应答。从这项研究中可以看出,ISDR突变型HCV对IFN治疗敏感性高,而中间型和野生型的敏感性低。

三、丙型肝炎病毒的复制

与其他黄病毒相似,HCV的复制周期由以下若干步骤组成:①HCV穿入宿主细胞并将其基因组RNA释放入细胞质;②以侵入细胞质的HCV正链RNA为模板,经翻译及蛋白裂解后,形成一个与细胞内膜状结构相结合的病毒复制酶复合物;③以侵入的HCV正链RNA为模板合成负链RNA作为复制中间体;④以负链RNA为模板合成正链RNA,正链RNA可以重新用于合成新的负链RNA、表达多聚蛋白以及作为基因组被包装入子代病毒粒子;⑤病毒粒子从感染细胞释放。