第七节 分子流行病学研究
分子流行病学是应用先进的实验技术加以测量生物学标志,并结合流行病学现场研究方法,从分子水平阐明疾病的病因及其与之相关的致病过程,并提出评价与防治措施的科学。分子流行病学是流行病学的一个分支,是介于传统流行病学与现代生物学技术,特别是分子生物学技术之间的一门边缘与交叉学科。分子流行病学的研究内容和应用范围很广,包括:疾病的病因探讨、分布规律以及危险因素致病机制的研究,疾病易感性的测定,防治效果评价等。而其中一个非常重要的内容,就是在群体研究基础上,从分子水平探索疾病的病因和发病机制。
分子流行病学最早在1970年被引入传染病的研究。汉坦病毒(Hantavirus)分子流行病学的核心内容是阐明病毒与宿主相互作用的分子事件,主要从分子水平研究病毒、宿主和疾病三者之间的关系及其影响因素。我们将此称之为“感染链”(chain of infection)及其影响因素。分析不同宿主、不同地区及不同时间的病毒间的差异及其与致病性之间的关系,有助于解释动物种群的迁徙变化及生态环境对病毒变异进化的影响,掌握HFRS/HPS的流行特征及预测趋势,并为更有效的控制和预防汉坦病毒的感染提供了理论依据和研究手段。
一、汉坦病毒的基因进化与系统发生
变异和自然选择是病毒进化的基础,分节段RNA病毒的RNA聚合酶由于缺乏校正和修复功能易发生遗传性变异。汉坦病毒是由L、M、S三个片段组成,分节段的负单链RNA病毒,其中以M基因所承受的来自宿主的免疫压力最大,变异最显著,而S片段3'NCR区核苷酸序列除手柄状部分外,其余部分差异亦较大,均有助于研究汉坦病毒进化。除基因突变外,分节段的汉坦病毒还能发生重组(recombination)或重排(reassortment)。伴随新的高通量测序技术的到来,基因序列变异的分析已用于汉坦病毒的研究。病毒的种群类型、新病毒的起源,病毒基因序列变异已用来回答一系列广泛的问题,也拓宽了流行病学的研究内容。
病毒流行病史的许多方面都可以通过系统发生树(phylogenetic tree)加以描述。进化是在时间跨度上的群体基因的变异累积,这些都可以通过计算机得到的系统发生分析(phylogenetic analysis)最终以“树”(tree)的形式展现出来。构建进化树的算法主要分为两类:独立元素法(discrete character methods)和距离依靠法(distance methods)。所谓独立元素法是指进化树的拓扑形状是由序列上的每个状态决定的,而距离依靠法是指进化树的拓扑形状由两两序列的进化距离决定的。进化树枝条的长度代表着进化距离。独立元素法包括最大简约性法(maximum parsimony methods)和最大似然法(maximum likelihood methods);距离依靠法包括除权配对法(UPGMAM)和邻位相连法(neighbor- joining)。在系统发生分析中,最常用的方法为最大似然法和邻位相连法。它明确地使用概率模型,其目标是寻找能够以较高概率产生观察数据的系统发生树。AIC准则(Akaike information criterion)、BIC准则(Bayesian information criterion)等其他客观方法用于确定最合适的模型的似然比检验。大多树的构建一般采用的数据包有PHYLIP、PAUP和TREE- PUZZLE程序。若RNA病毒发生重组,则对建立的系统进化树产生巨大影响。目前可用Simplot,或其他分解分析如TOPAL,PhylPro;资料场地分析如LARD或非同源测试应用软件测定重组是否发生。
汉坦病毒的基因进化与系统发生可通过以上软件进行分析,将汉坦病毒基因型、各病毒株之间的进化关系等数据信息以系统发生树的形式表现出来。根据不同毒株L、M、S片段的核苷酸序列将汉坦病毒分为四种类型:①HTN样病毒(HTN、SEO、DOB、SAA)由鼠亚科( Murinae)啮齿类动物携带;②PUU- PH样病毒(PUU、PH、TUL、BLL、ISLA、TOP、KHA)由田鼠亚科( Arvicolinae)啮齿类动物所携带;③SN样病毒(SN、NY、BAY、BCC、LAN、AND、ELMC、RIOS、RIOM)由棉鼠亚科( Sigmodontinae)啮齿类动物所携带;④TPM样病毒(TPM、MJN、ARR、JMS、SWS、ASA、TGN、CBN)由食虫目( Insectivora)动物所携带。这说明这些毒株3个基因片段存在四种相似的进化历程(图3-29),这也意味着汉坦病毒是非常古老的病原体,与其宿主动物之间存在一种长期相处的共进化(Coevolution,Cospecies)关系,这种关系至少有五千万年。
目前在GenBank中收录的汉坦病毒序列已经超过了3000条。汉坦病毒的定义和分类是根据1994年国际病毒分类命名委员会(International Committee on the Taxonomy of Viruses)提出的分型原则:①汉坦病毒的型(种):至少有一个基因片段的核苷酸序列和其他已知的汉坦病毒的同源性小于75%;②汉坦病毒亚型(亚种):至少有一个基因片段的核苷酸序列与该型的其他病毒有5%~24%的差异;③同一亚型:同一亚型病毒之间,所有基因片段的核苷酸序列差别小于4%;④最好是已分离到的病毒,若尚未分离到病毒,则由节肢动物病毒委员会决定。目前国际病毒分类命名委员会已列举出22个已确定的汉坦病毒种类和30个暂定的种类(表3- 10),然而这些分类不包括某些新型汉坦病毒。根据系统进化树某些汉坦病毒可以根据分支(lineage)进行分类,但是必须同时考虑地理分布、致病性或宿主。
图3-29 最大似然法系统进化树
啮齿类动物携带的三类汉坦病毒代表株与食虫目携带的汉坦病毒代表株的关系(R. N. Charrel,et al. Arenaviruses and hantaviruses:From epidemiology and genomics to antivirals. Antiviral research,2011)。基于部分N蛋白的氨基酸序列(147 aa,位置217- 365)。进化树由软件包TREE- PUZZLE 用JTT进化模式构建,比例尺为一个进化距离为一段序列上每个位置有0. 1的替换
表3-10 汉坦病毒基因型的地理分布
续表
续表
续表
注: *表示国际病毒分类命名委员会已列举出22个已确定的汉坦病毒种类
二、汉坦病毒基因型与自然宿主的关系
汉坦病毒的宿主范围非常广泛,全球有180种脊椎动物可以自然感染汉坦病毒,我国已查出82种脊椎动物携带汉坦病毒或病毒抗体阳性。汉坦病毒的自然宿主主要分为:啮齿目( Rodentia)中的鼠科( Muridae)、仓鼠科( Cricetidae),还有食虫目( Insectivora)中的动物。也有学者认为革螨、恙螨也携带汉坦病毒,并在黑线姬鼠巢内的革螨、蚤中分离到汉坦病毒,然而至今有关节肢动物是否携带和传播汉坦病毒还存在争议。
根据宿主线粒体基因构建的系统发生树,汉坦病毒与其对应的宿主的种系发生关系具有一致性,这种一致性目前被解释为病毒-宿主共进化假说。根据此理论,每型汉坦病毒与一种啮齿动物或食虫目动物相关,或也与同属的另一密切相关的动物相关。这种密切的病毒-宿主关系也决定病毒的属性,进而决定病毒对人的致病性。由于汉坦病毒与宿主动物间的对应关系,宿主动物的种群类型及其分布决定了疫区的性质及其分布,宿主动物的密度及其感染情况决定了人汉坦病毒的流行强度。因此,至今HFRS主要在欧亚大陆流行,而HPS主要在美洲大陆流行。目前食虫目携带的汉坦病毒型在世界范围都有发现,但并未发现致病。
汉坦病毒-宿主共进化假说也受到质疑和挑战:①同源的病毒由相关性不大的宿主所携带。最典型的例子如,Khabarovsk virus(KHAV)由东方田鼠携带,Topografov virus(TOPV)是由西伯利亚棕旅鼠所携带,进化分析发现这两种病毒是同源的,而它们的自然宿主却相关性不大。②没有证据表明汉坦病毒与其宿主之间有共分化的历史。与其宿主相比,汉坦病毒的分化时间要晚得多。比较同样由田鼠携带的新大陆汉坦病毒和旧大陆汉坦病毒同义突变速率来估算汉坦病毒的进化速率,发现第一次分离新旧大陆田鼠发生在更新世(Pleistocene)。假设病毒和其宿主共进化,那相应的置换速率应该为2. 41×10 -7~2. 68×10 -7核苷酸置换/位点/年。尽管这个速率比其他的RNA病毒,如流感病毒或HIV的同义突变速率要慢,但是还是比哺乳动物的突变速率要快。某些研究用贝斯定理、Markov链、蒙特卡罗方法估算了三种啮齿类亚科汉坦病毒的突变速率为10 -2~10 -4核苷酸置换/位点/年,与其他RNA病毒的突变率一致。同样,通过估算进化改变的速率(核苷酸的突变位点)和假定最接近的分子钟,可以得出流行于今天的RNA病毒大约出现在5万年前。这个结论最合理的解释是RNA病毒的分子钟并不是常量,或者这些病毒的确起源很早。因此,多年来病毒与宿主之间有着共同的系统发生关系被认为是共进化的证据只能被其他机制所解释。其一就是病毒能够冲破物种间的屏障,感染和原来宿主较为接近的动物。在35种负链RNA病毒中,有5种病毒有同源重组(homologous recombination)的现象,包括汉坦病毒中的HTNV和PUUV,后来又发现存在于TULV和DOBV中。然而整个同源重组率较其他变异低,并不是负链RNA病毒的进化驱动力。因此,汉坦病毒与宿主之间相似的种系发生关系的可能是宿主转换和适应的结果。
汉坦病毒从其自然宿主溢出(spillover)到其他动物的宿主转换(host- switching)的现象和不断发现的新病毒、新宿主等都不能解释共进化理论。对由臭鼩鼱携带的Thottapalayam virus(TPMV)全基因序列分析发现,它由一种啮齿类动物携带的汉坦病毒的早期进化分支而来。检测1980~2009年从欧洲、亚洲、非洲以及南美洲捕获的鼩鼱和鼹鼠体内的汉坦病毒,进化分析显示由鼩鼱目动物携带的汉坦病毒可以分为3支,其中一支与啮齿类动物携带的病毒类似,而另两支在进化上与现有的汉坦病毒存在明显区别,共进化分析表明汉坦病毒及其宿主——鼩鼱目动物之间有较好的进化拓扑关系。这些都说明汉坦病毒与其宿主之间的进化历史比共进化理论要复杂得多。
三、汉坦病毒基因型的地理分布
在某一疫源地区内,汉坦病毒通过“感染链”(chain of infection)对人致病:即汉坦病毒长期在某一特定的自然宿主(host)体内时表现为无症状的持续感染,由于病毒变异或某些环境(environment)因素的改变,可成功传染给人并引起肾综合征出血热(hemorrhagic fever with renal syndrome,HFRS)和汉坦病毒肺综合征(Hantavirus pulmonary syndrome,HPS)。汉坦病毒在全世界范围内分布。不同基因型汉坦病毒的分布根据宿主的分布范围具有地域性特点,流行于世界不同地区的HFRS/HPS是由不同类型的汉坦病毒所致。HTNV主要分布在亚、欧大陆;SEOV呈全球分布;PUUV和DOBV主要分布在欧洲;SNV和ANDV主要分布在美洲大陆。以前认为汉坦病毒仅存在于亚洲、欧洲以及美洲,最近发现也存在于非洲(见表3- 10)。TPMV被发现后,越来越多的食虫目动物不断被证明为汉坦病毒的新宿主,但它们的致病性并不清楚。分型研究的意义主要在于不同的病毒型有其独特的地理分布及生态学特点,致病性也各有不同。弄清流行毒株的型别和基因型的分布能有效指导该病的防治,采取有的放矢的防治对策和措施。
目前,在我国流行的汉坦病毒至少有9个基因型,但是引起HFRS的病原体仍然为HTN 和SEO两型病毒(表3- 11),但各型病毒的分支分布差异较大,其中HTN可分为9~11个分支,而SEO则有4~6个分支(图3-30)。各分支的地理分布见表3- 12。也有学者报道在东北地区动物体内发现PUU,并在我国湖北地区患者体内发现抗PUU抗体,但尚未分离病毒成功。随着研究的深入,将会有更多的啮齿动物或其他动物被发现携带汉坦病毒,也有更多的汉坦病毒基因型/血清型或亚型被发现。
表3-11 我国的汉坦病毒基因型的地区分布
图3-30 基于S片段编码区的HTNV 和SEOV系统进化树
注:根据HTNV和SEOV S片段全长编码序列(1290 nt),应用PAUP* 4. 0软件Neighbor- joining分析获得的种系发生树。Bootstrap值由1000次重复计算获得,在分支节点处仅显示>50%的数值。Sin Nombre virus(SNV)病毒株NM- H10 (GenBank NC _005216)为外群。HTNV的分支编号参照Wang,et al(Wang,et al. 2000),但有如下改动:①NC167和AH09病毒原来分类归于HTN,编号为HTN- #1,但最近将其分为新的血清型,称为大别山病毒(Da Bie Shan virus,DBSV)(Zhang,et al. 2010)。②ZLS6- 11和ZLS-12病毒株形成一新的分支(Yao,et al. 2009),在此编号为HTN- #10。③N8病毒株形成一新的分支,在此编号为HTN- #11。SEOV的分支编号参照Wang (Wang,et al. 2000),Shi(Shi,et al. 2003),Zhang(Zhang,et al. 2010)。分支SEO- #2病毒没有全长S片段编码序列,故未纳入分析
表3-12 我国和部分国家HTNV和SEOV型分支的地理分布
续表
我国已证明存在着姬鼠型、家鼠型和混合型HFRS疫区。新发疫区患者病死率高,并具有地区性、暴发性和易变性的流行特点。HFRS的高发地区,如山东、湖北、陕西、浙江、江西、安徽、黑龙江等,已在不同程度上演变为混合型疫区。其中,山东是以家鼠型为主的混合型疫区,其余高发病省均是姬鼠型为主的混合型疫区,单一的姬鼠型或家鼠型疫区均较少。2003年报道有普马拉型(PUU型)出现,近期的研究也发现我国长江中游地区HFRS患者血清与PUU型血清有交叉反应,但尚未发现基因水平的证据,PUU是否能通过自然宿主传播到人并引起疾病流行尚不清楚(表3- 11)。近年来有报道,在我国北京、沈阳、昆明、湖北等地有SEOV引起的疾病散发与流行,这可能与SEOV基因特征有关系。对长江中下游地区汉坦病毒与自然宿主的进化关系研究发现,SEOV基因型不稳定,易发生变异,病毒单个基因的突变导致氨基酸的变化可以改变病毒的致病性和感染性并引起疾病的暴发与流行。也有研究者发现了流行于云南KY株存在M基因的重组现象。在俄罗斯中部暴发的两次HFRS是由黑线姬鼠携带的一种多布拉病毒(Dobrava virus,DOBV)亚型DOBV- Aa引起,但是流行于南部地区的HFRS由高加索姬鼠携带的DOBV- Ap引起,且两种汉坦病毒的临床表现存在明显不同。这些研究都说明汉坦病毒变异直接可以造成HFRS/HPS流行特征的改变。若变异引发病毒毒力即致病性的改变,则现有疫苗可能失去保护效果,最终导致新疫区的出现和HFRS的暴发流行。
四、汉坦病毒基因型与疾病的传播和发生
采用分子流行病学的研究方法可以得到汉坦病毒如何从自然宿主传播到人并引起疾病流行的证据。1983年加利福尼亚鹿鼠肺组织中的病毒的基因特征类似于1993年美国四角地区出现的HPS患者体内的病毒,这种病毒的M片段的变异与宿主的进化是平行的。在病原学确诊的HPS患者可能的感染场所大量收集宿主动物的标本,再对患者和宿主动物标本中的汉坦病毒的部分M及S片段的核苷酸序列测定与分析,结果表明,一个场所测得的宿主动物与患者所感染病毒的序列完全一致,建立了病毒从宿主到人之间的感染链关系。同样,在阿根廷和智利所发生的由AND病毒所引起的HPS流行中,研究者对HPS流行情况和感染人员的流行病学调查后提出了人-人传播的可能性。其他人在此基础上,对血清学检查26例阳性活检材料标本中的M片段Gna、Gnb和Gc编码区以及S片段的3’非编码区进行了RT- CR扩增及测序,发现其中16例为同一种病毒所感染,证实了这种可能性。
汉坦病毒可引起临床表现多样化的急性传染性疾病。汉坦病毒可引起两种临床症状不同的疾病:HFRS和HPS。HFRS临床分为轻、中、重型,其中HTNV和DOBV主要引起中、重型HFRS;SEOV和PUUV引起轻型HFRS,而汉坦病毒感染其自然宿主却没有明显的临床表现,原因在于:①汉坦病毒S、M基因变异显著,ELMC亚型的Gn、Gc蛋白的氨基酸序列与FC亚型相比仅73. 5%和82. 3%同源,而比较不同型别汉坦病毒代表株NP氨基酸序列,属特异性抗原的同源性为76%~94%,型特异性抗原只有41%~82%同源。②汉坦病毒的外膜糖蛋白(glycoprotein,Gn&Gc,GPs)和衣壳核蛋白(nucleocapsid protein,NP)共同决定了其毒力和致病性,与HFRS的发生、发展与转归有关。GPs不仅能够介导汉坦病毒与整合素受体结合进入宿主细胞,还是机体内中和抗体的靶抗原。NP可诱导细胞凋亡,具有很强的抗原性和免疫原性。GPs一级结构或空间构象微小的改变就能导致汉坦病毒感染力的改变:将Gc N928残基修改后,汉坦病毒就不能在Vero- E 6细胞中表达;通过基因重排证明Gn单一氨基酸的变化即可导致病毒毒力的变化。NP某个位点的改变就可以导致不同亚型PUUV的表型不一。S基因点突变导致的NP功能改变可以使得汉坦病毒能在Vero- E 6细胞中适应。③不同基因性的汉坦病毒发病机制不一样,可引起的宿主免疫反应各有不同。汉坦病毒感染自然宿主不能产生足够的中和抗体,导致病毒不能全部被中和并终身排毒。而汉坦病毒感染人体后,可诱导机体产生足够的中和抗体使得病毒被清除,由此并带来一系列的免疫损伤。对东欧地区HFRS患者的临床资料,血清、分子诊断结果分析得出DOBV- Aa、DOBV- Af、DOBV- Ap和PUUV造成了该地区HFRS、流行性肾病的流行,而前者毒力最低,临床症状最轻。不同型别的病毒在感染人时引起的免疫反应各有差异,表3- 13所示为不同汉坦病毒的基因型在体外引起的免疫反应特征。
表3-13 不同汉坦病毒的基因型在体外引起的免疫反应特征
续表
注:↑表示上升,-表示没有变化或不明显,↓表示下降
五、环境对病毒基因的影响
汉坦病毒的感染链是基于某一特定的生态环境中,因此,研究生态环境等因素是如何影响啮齿类动物、它们的觅食来源和习性等能让我们理解环境是如何影响汉坦病毒在自然宿主体内持续感染或从动物传播到人的。
汉坦病毒的在人群中的感染水平与鼠密度成相关性。原因在于气候、鼠类栖息地条件、鼠类繁殖强度、种群构成等因素的变化影响鼠密度,而宿主动物病毒感染率随着时间和地点的不同不断发生变化。不同的鼠密度、宿主动物病毒感染率和与人群接触的机会,影响疾病的暴发或散发。对阿根廷境内自然状态下啮齿动物中病毒载量及其特征,如种类、密度、性别、地理分布、IgG抗体的对应关系进行研究,以评估病毒感染人潜在的危险性,结果认为在疾病暴发时,非汉坦病毒宿主由于病毒的“溢出”可能在病毒复制的过程中发挥作用。此外“稀释影响假说”认为在多样性的种群中,非适应宿主将会影响病毒在其适应宿主中的传播,以及感染人的可能性。此外,对比利时PUUV感染变化的特征进行研究,发现欧洲棕背 的数量与PUUV感染暴发有直接关系,而欧洲棕背 增殖活性和繁殖季节的长度在PUUV感染风险中起决定性作用,是PUUV动物流行病学的内在驱动力。
全球气候变暖与人感染汉坦病毒有密切联系:将比利时流行性肾病(NE)的数据与季节温度、降雨量分析表明,前一年夏季较高的温度促使第二年农作物收获较好,这使得欧洲棕背 有足够食物过冬,同时当年秋天较高的温度也使欧洲棕背 的存活率上升导致NE发病数量上升乃至暴发。2005年以来芬兰、法国NE的情况与温度也有类似的联系。
欧洲NE主要由PUUV引起,而70%的病例在芬兰,这是因为欧洲北方地区宿主数量增长较快,森林连续覆盖较南方好。而对PUUV在欧洲北方地区传播的动态变化研究表明,森林的不连续对PUUV的动态变化无影响,而北部没有屏障使得欧洲棕背 可以自由迁徙,因而PUUV可在大范围内存在,造成较多的感染病例。森林连续覆盖到底有无影响还需进一步研究。
应用SIR模型(susceptible,infective and remove with immunity)和MISO(a multiply- input,single- output)的联合模型,用1996~2007年比利时气候数据作为参数预测NE动态变化的情况,得出的NE发病率决定系数达到0. 7。因此该模型有望用于预测和监控NE发病情况。地理信息系统(geographic information system,GIS)技术可直观地描述HFRS的空间分布和发生、发展规律。通过GIS特有的空间分析功能对HFRS疫区在不同尺度上进行时空聚集性分析与比较,研究疫源地动态变迁规律及其与环境变化的关系,有助于弄清HFRS发病率动态变化以及与之相关的地理环境因素,尤其是结合不同时期的遥感资料后,可及时正确地预测、预报HFRS流行的范围和强度,从而为采取适宜的控制措施打下基础。我国研究者发现山东省HFRS的发病率与降雨量、湿度和温度有关。而北京地区是HFRS发生的一个热点(hotspot),发生变异和重组的SEOV是造成HFRS的主要原因,HFRS发生与建筑工地、果园、耕地有密切联系。
(杨占秋 凌佳馨)