发展性阅读障碍的遗传关联分析_等位基因论文

发展性阅读障碍的遗传关联分析,本文主要内容关键词为:发展性论文,障碍论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

分类号 B845;B844

1 引言

发展性阅读障碍(Developmental Dyslexia)是在儿童学龄期普遍出现的一种学习障碍(Fisher et al.,2002;Scerri & Schulte-Krne,2010)。近百年来,研究者试图用多种学科的知识和技术(神经心理学、大脑解剖学和神经成像技术等)去解释它的原因。但造成阅读障碍的根本原因至今依然不明确,全新学科领域的加入将有利于研究者对阅读障碍的全面理解,阅读障碍的分子遗传学研究是在近20年飞速发展的领域,阅读障碍候选基因的发现为从病原学角度揭示阅读障碍的原因提供了直接证据,从遗传视角对发展性阅读障碍进行探索成为一种新的研究趋势。

阅读障碍的遗传研究主要回答以下两个问题:第一,遗传是否能影响阅读障碍,如果能,它在多大程度上可以解释阅读障碍的原因。第二,遗传是怎样影响阅读障碍的,最直接的证据就是找出影响阅读障碍的候选基因。

传统的行为遗传学研究主要回答了第一个问题,即遗传确实能够影响阅读障碍。双生子研究是行为遗传学的经典研究方法,一系列双生子的研究发现,阅读障碍具有很高的遗传性(DeFries,Fulker,& LaBuda,1987;Harlaar,Spinath,Dale,&Plomin,2005;Hawke,Wadsworth,& DeFries,2006)。

分子遗传学的研究主要回答了第二个问题,即找到阅读障碍的候选基因。最早应用于阅读障碍分子遗传学研究的是连锁分析方法。连锁分析是基于家系的一种研究方法,检测在一个家系中等位基因与疾病的传递是否相关,连锁分析的基本研究思路是:在一个患有某种疾病或者认知障碍的家系中,鉴定经过多代的传递后依然留存的DNA片段,位于这个区域的遗传标记被认为同真正的致病基因是连锁的,因此锁定这个DNA片段就是致病基因的位置区域。1983年,研究者在家系中运用连锁分析的方法,发现与阅读困难有关的基因位于15号染色体的长臂(Smith,Kimberling,Pennington,&Lubs,1983)。自此至今,运用连锁分析的方法共发现11个与阅读障碍有关的基因位点(Poelmans,Buitelaar,Pauls,& Franke,2011)。国内的相关综述对这些研究也进行了总结,孟祥芝和周晓林(2002)以及高兵和杨玉芳(2005)的综述主要关注了发展性阅读障碍行为遗传学领域的主要发现,而对分子遗传学领域的描述主要集中在连锁分析上,另外的两项综述也是主要介绍了运用连锁分析在各染色体和基因上的发现(陈英和,王治国,2005;王久菊,毕鸿燕,卫垌圻,翁旭初,2008)。

但是,随着新技术的发展,连锁分析逐渐表现出一些不足,这些不足使连锁分析始终不能解决阅读障碍遗传研究中的一些难点问题。首先是在样本采集方面,连锁分析需要在几代人的家系中进行,因此在采样中经常出现缺失或者偏差,能否有一种方法能够超越家系的限制,在无亲缘关系的个体中进行随机取样?其次是在基因的精确定位方面,连锁分析只能把与阅读障碍有关的基因定位在包含500万到1000万个碱基对的染色体区域(Gibson & Gruen,2008),能否有一种方法将这种定位精确到1个甚至几个碱基对水平?最后是在统计效力方面,连锁分析都是在家系中进行,统计分析时需要设定遗传方式等各种参数,因而降低了统计效力,能否有一种方法在不设置各种遗传参数的前提下直接进行相关分析以提高统计效力?关联分析是分子遗传学中一种较新的研究方法,它能够很好地回答上述三个问题,是一种能够超越家系的限制,对基因进行精细定位,并实现较高统计效力的研究方法。Taipale等人(2003)运用这种方法发现了阅读障碍的第一个候选基因DYX1C1,从此以后,越来越多的研究开始从连锁分析转向关联分析,开启了阅读障碍关联分析的进程。本文主要探讨了阅读障碍关联分析的基本原理、研究方法以及与其它技术相结合的新趋势。并重点介绍和比较了关联分析三种研究方法(家系法、病例-控制法、数量性状关联法)的原理及其优缺点。

2 阅读障碍关联分析的基本原理

关联分析是检测在一个群体中等位基因与患病与否是否相关,是一种可以超越家系的研究方法。关联分析的基础是连锁不平衡(linkage disequilibrium)。连锁不平衡是指位于同一条染色体上的两个等位基因之间的非随机相关,因此又被称为等位基因关联(allelic association),说明两个等位基因之间并不是随机独立的,存在一定的相关,通常认为两者在染色体上的距离较近。

作为关联分析的基础,连锁不平衡的目的是发现与某一性状相关联的基因位点。结合关联分析的具体操作过程可以深入理解连锁不平衡的概念。以经典的病例-控制法为例,假设两个位点的等位基因分别为A、a和B、b,等位基因A是与阅读障碍有关的基因,等位基因B是遗传标记,且A和B之间存在连锁不平衡即相关,那么,通过观察标记等位基因B在障碍组和控制组的次数分布,可以确定等位基因A是否也与阅读障碍有关。

基于连锁不平衡的原理,可以通过检测人类基因组中的大量遗传标记,来寻找真实的造成阅读障碍的致病位点或者离致病位点距离足够近而表现出与障碍相关的位点,这里所说的遗传标记是理解关联分析基本原理时的重要概念,单核苷酸多态性标记(Single Nucleotide Polymorphism,简称SNP)是一种近年来主要应用于关联分析的遗传标记,人类基因组绝大多数核苷酸位置上只存在一种核苷酸,而SNP是指在某些特定的核苷酸位置上出现了两种核苷酸。这类多态性可以用来作为遗传标记。与连锁分析常用的另一种遗传标记短串联重复(Short Tandem Repeats,STR)相比,SNP具有数量更多,分型更简便等特点。SNP在关联分析中的应用,使得阅读障碍的遗传研究更加精细化,将致病原因集中到核苷酸水平,从而找出致病的风险基因。

总之,关联分析就是运用以SNP为代表的遗传标记,通过对比障碍群体和正常群体在基因型上的差异,找出与阅读障碍相关的基因,这就是阅读障碍关联分析的基本原理。

3 阅读障碍关联分析的研究方法及其发现

阅读障碍关联分析的研究方法可以分为三类:家系法、病例-控制法和数量性状关联分析法,其中家系法并没能超越家系的限制,病例-控制法超越了家系的限制,而数量性状关联分析法既能够超越家系的限制,又能够将研究群体拓展到正常人群。因此,这三种方法呈现出一种优势递增的趋势。下面将对这三种研究方法进行介绍,并对运用这三个方法得到的相关成果进行总结,这些成果主要集中在阅读障碍遗传研究中发现最为广泛的三个基因(DYX1C1,DCDC2和KIAA0319)。

3.1 家系法

家系法(family based)是利用患病儿童的家长作为控制组,直接与自己的孩子作对比而进行的一种关联分析的方法,由于有家系的信息,所以很好地控制了可能存在的人群分层(population structure)问题。传递不平衡检验(Transmission Disequilibrium Test,TDT)是目前家系研究中常用的方法,它在家系内进行关联分析,观察双亲(至少一个是杂合子)将标记位点等位基因传递给患者的频率。具体来说假设一个遗传标记M的两个等位基因是M1和M2,杂合子(M1M2)将等位基因M1传递给障碍后代的数目记为b,将等位基因M2传递给障碍后代的数目记为c,对(b-c)[2]/(b+c)的结果进行χ[2]检验,差异显著提示该等位基因可能与障碍关联。

阅读障碍候选基因DYX1C1的争鸣过程充分体现了家系法的作用。2003年在芬兰群体中首次发现基因DYX1C1上的两个SNP(rs3743205和rs57809907)与阅读障碍显著关联(Taipale et al.,2003),虽然这一发现采用的是病例-控制法,但后续的一系列验证研究大多采用了家系法中的传递不平衡检验(TDT)。与最初芬兰群体中的发现不同,在澳大利亚、英国、德国、意大利和美国人群中进行的家系研究都没有发现上述两个SNP与阅读障碍的显著相关(Bates et al.,2009;Cope et al.,2004;Dahdouh et al.,2009;Marino et al.,2005;Meng et al.,2005)。但也有几项家系研究发现了部分相同的结果,有的是发现了相同的SNP,有的是虽然含有相同的SNP,但风险等位基因的方向与最初芬兰群体的发现相反(Brkanac et al.,2007;Marino et al.,2007;Scerri et al.,2004;Wigg et al.,2004)。

此外,研究者运用家系法对基因DCDC2和基因KIAA0319也进行了一系列的分析,发现的结果较基因DYX1C1更为一致(Brkanac et al.,2007;Harold et al.,2006;Luciano et al.,2007;Ludwig et al.,2008;Marino et al..2012;Meng et al.,2005;Schumacher et al.,2006)。

家系法是关联分析中应用较多的一种研究方法,运用它发现了一些阅读障碍的候选基因,同时对某些候选基因进行了有效的重复验证。家系法的最大优点是考虑到了人群分层可能造成的影响,但缺点是同连锁分析一样,没能超越家系的限制,从而影响到采样的效率和统计的效力。

3.2 病例-控制法

病例-控制法(case-control)不需要采集家系信息,它是通过比较病例组和控制组在某种遗传标记上等位基因的频率,找出两组中差异显著的遗传标记,进而发现与疾病或者认知障碍相关联的基因。病例-控制组法通常使用检验(比较病例组和控制组的基因型或等位基因频率)或odds ration(比值比,病例组中携带某种基因或基因型的人数和未携带人数的比值与控制组中携带某种基因或基因型的人数和未携带人数的比值的比)进行检验。

运用病例-控制法最大的发现就是阅读障碍的第一个候选基因DYX1C1,研究者首先在芬兰家庭中发现了基因DYX1C1所在的15号染色体易位t(2;15)(q11;q21)和阅读障碍的共分离(NopolaHemmi,Taipale,Haltia,Lehesjoki,Voutilainen,&Kere,2000)。Taipale等人(2003)在芬兰群体中运用病例-控制法进行了深入研究,选取障碍组109人和控制组195人进行关联分析,发现两个SNP(rs3743205和rs57809907)与阅读障碍显著关联,这两个SNP组成的单倍型也与阅读障碍显著相关。但Bellini等人(2005)在意大利人群中,运用相同方法进行研究,并未得出Taipale等人的结果。这也使研究者开始争论基因DYX1C1的作用。

运用病例-控制法同样发现了基因DCDC2和基因KIAA0319的作用。研究者运用这种方法,首次在德国群体中发现了基因DCDC2与阅读障碍的相关(Wilcke et al.,2009)。在英国人群中,Cope等人(2005)发现基因KIAA0319上的一个SNP(rs4504469)与阅读障碍显著相关,这一结果在后面的包含143个核心小家庭的半独立样本中得到了验证。

病例-控制法是关联分析中较为经典的一种研究方法,不依赖家系进行研究是它最大的特点,运用它发现了阅读障碍的第一个候选基因DYX1C1(Taipale et al.,2003)。但是这种方法并不适于研究在人群中发生率很低的疾病或认知障碍,因为这需要很大的样本量,而且选择研究对象时,难以避免选择偏倚。因此在阅读障碍的研究中应充分考虑到这些优缺点。

3.3 数量性状关联法

数量性状关联法(quantitative trait association)不同于病例-控制法,前者是对数量性状进行的关联分析,后者是对是否障碍这个二分变量作分析。数量性状通常是一个多基因和环境共同影响的产物,在人群中呈现正态分布。儿童的阅读能力就是一种典型的数量性状,较早运用此方法的研究发现了基因DYX1C1与单词阅读、单词识别、拼写能力、音位意识和语音解码能力都存在相关(Wigg et al.,2004)。数量性状关联分析中又存在很多具体的方法,结合发展性阅读障碍的特点和目前的国情,数量性状关联法中的两类研究是最有应用前景的:一类是相对于家系法,不需要家系的信息,只采用儿童的数据进行分析;另一类是相对于病例-控制法,不需要障碍群体,完全采用正常群体进行分析。

第一类是只采用儿童数据(没有家长信息)进行研究,Paracchini等人(2008)在英国儿童中进行的一项研究说明了这种方法的优势,选取6000名7岁到9岁的儿童,对基因KIAA0319上的4个SNP进行数量性状关联分析,选取的数量性状包括阅读能力、拼写能力、非词阅读、音位意识和准确性。发现基因KIAA0319上的1个SNP(rs2143340)与儿童的阅读能力和拼写能力显著相关。该研究并没有采用基于家系的分析方法,方便了取样,通过大样本(6000名儿童)的选取弥补了人群分层可能造成的影响,也就是说当取样量足够大且无偏时,数量性状关联分析可以不基于家系,即不对家长进行采样,这样不仅可以提高研究效率,更符合一些没有建立起阅读障碍儿童数据库的研究背景,如中国大陆地区的阅读障碍研究。

第二类是完全采用正常群体进行研究,一项来自澳大利亚群体的研究充分说明了这种方法的优势,研究者选取522个双生子家庭进行了数量性状关联分析,考察的基因是DCDC2上的21个SNP,考察的数量性状是与阅读相关的认知能力,包括词汇加工能力(不规则词阅读)、语音解码能力(非词阅读)和拼写能力。结果发现两个SNP与阅读能力相关,其中一个SNP(rs1419228)与规则词的阅读、规则词的拼写以及不规则词的阅读显著相关,另一个SNP(rs1091047)与不规则词的阅读有关(Lind et al.,2010)。该研究一方面验证了基因DCDC2与各种阅读技能的相关,另一方面将基因对阅读技能的影响扩展到正常群体。这对阅读障碍的定义具有启发意义,有研究者曾对阅读障碍做出下述定义:阅读障碍代表了正常群体中连续分布的阅读能力的尾端(Shaywitz,Escobar,Shaywitz,Fletcher,& Makuch,1992)。该研究证实了这种界定,同时说明了基因会同时影响落后的阅读能力和优秀的阅读能力,采用数量性状关联分析的方法,保留了这种正常分布下的变异,增大了遗传检验的效力。

总结上述三种研究方法,将数量性状关联分析与另外两种方法进行比较,一方面数量性状关联分析不需要像家系法中那样必须有家系的信息,另一方面也不需要像病例-控制法中那样必须选取障碍群体,加之这种方法得到的结果较前两种更为丰富,这些方面的优势使数量性状关联分析方法成为研究正常群体阅读能力的高效、有力的关联分析方法。另外,追踪研究是儿童阅读研究领域中的重要组成部分,中国最近的一项追踪研究通过对一系列语言认知技能的分析,将儿童的阅读发展轨迹分为四类(Lei et al.,2011),研究者可以进一步结合儿童的基因数据,对这些与阅读相关的认知技能进行数量性状关联分析,发现基因在追踪数据中的预测功能。

4 阅读障碍关联分析研究的新趋势

随着阅读障碍关联分析技术的不断成熟,研究者开始关注它与其它新技术的结合,以期在发展性阅读障碍的研究中有新的突破。总的来说,阅读障碍的关联分析研究呈现出以下几个新趋势:首先是全基因组关联分析的应用;然后是关联分析与神经成像技术的结合;最后是关联分析与基因功能研究的结合。

4.1 全基因组关联分析

全基因组关联分析(Genomewide Association Study,GWAS)是在人类数以百万计的单核苷酸多态性标记SNP中,找出存在变异的基因序列,进而发现复杂性疾病发生的遗传机制的一种新策略。

在语言研究领域中,研究者在2007年首次运用全基因组关联分析方法研究了阅读能力的遗传机制(Meaburn,Harlaar,Craig,Schalkwyk,& Plomin,2007)。选取5760名正常儿童进行了两阶段分析,第一阶段选取755名低阅读能力儿童和747名高阅读能力儿童进行全基因扫描,对照筛选出的造成阅读能力差异的75个SNP,第二阶段选取更大的样本(4258名儿童)进行验证分析,发现75个SNP中的9个SNP得到了重复验证。此外,Roeske等人(2011)运用全基因组关联分析的方法,研究了与语音加工有关的脑电成分MMN的遗传机制。

作为多基因影响的阅读障碍,全基因组关联分析便于在短时间内尽可能多的筛选出影响阅读障碍的SNP,促进了更多阅读障碍候选基因的发现,为全面发现阅读障碍的遗传机制提供了更多的线索。然而作为一项全新的技术,势必会存在一定的问题,例如人群分层和多重比较造成的虚报或漏报等。

4.2 关联分析与神经成像技术的结合

随着分子遗传学和神经成像技术的发展,将遗传研究与神经成像技术相结合成为一种新趋势,这种结合方法的实质是对传统的遗传关联分析的一种延续,以阅读障碍的研究为例,传统的遗传关联分析选取的是与阅读加工相关的行为指标(如语义加工、语音加工的反应时或正确率),而关联分析与神经成像相结合选取的是与阅读相关的神经生理指标(如fMRI研究中语义相关脑区的激活强度、脑电研究中MMN的波幅等),探讨在阅读加工过程中,不同基因型的个体在大脑加工机制上的差异。首次将两项技术结合是在记忆研究的领域,Papassotiropoulos等人(2006)在Science杂志上发表了“基因KIBRA与大脑中海马区的激活相关”的研究,开启了关联分析与神经成像技术相结合的研究方向。

在语言研究领域中,Meda等人(2008)将基因分析与基于体素的形态学研究(voxel based morphometry,VBM)相结合,发现基因DCDC2与大脑灰质的分布有关(主要在语言相关区域),基因DCDC2在大脑左半球有更高的表达,且不同基因型个体的灰质体积存在显著差异。Krug等人(2009)将遗传分析与脑功能成像技术(fMRI)相结合,对80名正常个体进行了语义流畅性任务的行为和脑成像研究,发现在行为层面无差异,但在脑成像层面,位于大脑左侧前额角回的激活强度与基因COMT显著相关,等位基因val的个数越多,该脑区的激活越强。Roeske等人(2011)和Czamara等人(2011)利用基因分析与脑电的结合,发现了基因对语音加工神经生理机制的影响,Roeske等人(2011)对基因和语音加工有关的脑电成分MMN(Mismatch Negative)进行了研究,发现位于4号染色体3区2带上的一个SNP(rs4234898)与MMN的晚成分(大约出现在300ms-710ms)显著相关,风险基因携带者的MMN晚成分显著小于非携带者。将遗传研究同神经成像技术相结合,可以从基因层面解释脑机制的差异进而解释行为层面的差异。一方面,神经成像技术为遗传研究提供了比传统行为测量(表型)更为稳定和灵敏的测量,可能是一种内表型(endophenotype);另一方面,从基因角度解释个体脑机制的不同丰富了神经成像技术的研究。两者互相补充,共同促进对阅读障碍遗传和脑机制的深入理解。

4.3 关联分析与基因功能研究的结合

与之前常用的连锁分析相比,关联分析最大的优点是,对遗传位点进行更加精细的定位,使之缩小到了碱基水平,通过分析SNP组成的基因型便能推出基因的表达。利用这一优点,研究者将关联分析与基因的功能研究相结合,从分子层面深入了解阅读障碍的遗传机制。

作为阅读障碍的第一个候选基因DYX1C1,人类的DYX1C1蛋白质同小鼠高度相似,Rosen等人(2007)对小鼠大脑新皮层的DYX1C1基因进行了RNA干扰,发现RNA干扰破坏了大脑神经元的正常迁移,这种神经元的异常迁移在阅读障碍患者大脑的验尸报告中得到了相似的结果。Schumacher等人(2006)对另一个阅读障碍候选基因DCDC2进行了基因功能研究,发现基因DCDC2主要在胎儿和成人的中枢神经系统进行表达,这个基因所包含的双皮层蛋白异形同体参与了人类大脑皮层神经元的迁移,对阅读障碍患者的验尸报告同样发现了基因DCDC2表达区域神经迁移的异常。为了进一步探讨神经元异常迁移对阅读障碍的影响,研究者对小鼠大脑新皮层神经元的异常迁移进行了研究,发现这种异常迁移会影响听觉加工能力和空间学习能力,这些能力在阅读中都具有重要作用(Burbridge et al.,2008;Peschansky et al.,2010;Roeske et al.,2011;TapiaPáez,Tammimies,Massinen,Roy,& Kere,2008;Threlkeld et al.,2007)

将关联分析与基因功能研究相结合,在基因和大脑之间架起一座桥梁,这种结合能够检验出基因表达这一过程,通过蛋白质以及神经细胞的活动来解释大脑乃至行为的活动,从而真正找出复杂疾病或者认知障碍的病原学原因。

5 总结和展望

与传统的连锁分析相比,关联分析具有超越家系、定位准确、统计效力强的优点。从Taipale等人(2003)运用关联分析方法发现阅读障碍的第一个候选基因至今的不到10年间,已经有上百项阅读障碍的关联分析研究。其中运用数量性状关联分析方法的研究,得出了比其它两种关联分析研究方法更为丰富的结果,证明了“阅读障碍代表正常群体中连续分布的阅读能力的尾端(Shaywitz et al.,1992)”这一观点。阅读障碍关联分析与其它新技术的结合显示了今后研究的发展趋势,全基因组扫描与神经成像技术的创新性应用,促进了从“基因-大脑-行为”全面理解发展性阅读障碍的遗传机制,最后将阅读障碍关联分析的新趋势以基因功能研究为落脚点,可以帮助我们找到基因致病的根本原因,通过对基因本身或者基因表达的干扰,来对阅读障碍进行有效干预,从而真正实现在应用层面的发展。

值得注意的是,发展性阅读障碍属于多基因遗传(polygenic inheritance)疾病,它的遗传受多个基因的共同影响,因此基因和基因之间的相互关系成为阅读障碍遗传研究中的难点之一,不同基因对阅读障碍的贡献大小如何?不同基因对阅读障碍的共同作用模式如何?不同群体中基因之间的关系是否相同?这些在目前的关联分析研究中还探讨的较少,是今后关注的方向之一。此外,作为多基因遗传疾病,阅读障碍不仅受遗传因素的影响,还受环境因素的影响(Rutter,Moffitt,&Caspi,2006),因此基因和环境之间的交互作用成为阅读障碍遗传研究的难点之二,已经发现的交互作用模式可以分成两大类,一种模式是素质,压力模型(diathesis-stress model),它认为在高风险的环境下,遗传因素更易发挥作用,而在较好的环境下无法明显看到遗传因素的表达(Rende & Plomin,1992)。另一种模式是生物生态模型(bioecological model),它认为丰富的环境有利于遗传因素的表达,而高风险的环境会掩盖遗传因素的差异(Bronfenbrenner & Ceci,1994)。研究者发现儿童早期言语能力中遗传和环境的交互作用趋向于素质-压力模型的模式(Asbury,Wachs,& Plomin,2005)。而在另一项儿童单词识别能力和父母受教育水平的研究中却发现这种交互作用趋向于生物生态模型(Kremen et al.,2005)。可见,目前对儿童阅读领域中遗传和环境交互作用的结论并不一致,因此,探讨基因和环境的交互作用,为全面理解阅读障碍的原因提供了一个有效途径。另外,作为传统遗传学研究的补充,表观遗传学(epigenetics)是在近几年迅速发展的领域,它基于非基因序列改变所致的基因表达水平的变化,如DNA甲基化和染色质构象变化等,其突出优点是不局限在DNA序列层面考察阅读障碍的遗传因素,是发现阅读障碍遗传新机制的一个很有潜力的方向。

目前,阅读障碍的遗传研究主要集中在拼音文字国家,对中国儿童阅读障碍的遗传研究还很少。即使在拼音文字系统中进行的研究,不同国家的群体之间也很难得出完全一致的结果,这说明语言本身的属性在很大程度上影响了其背后的遗传机制。因此,汉字作为一种不同于拼音文字的表意文字,在遗传机制上会与拼音文字存在不同。对汉语儿童的阅读障碍进行遗传研究,势必为儿童发展性阅读障碍的研究注入新的活力。

标签:;  ;  ;  ;  ;  ;  ;  

发展性阅读障碍的遗传关联分析_等位基因论文
下载Doc文档

猜你喜欢