LDL受体基因1972T/C SNP及MTHFR基因677C/T SNP研究

LDL受体基因1972T/C SNP及MTHFR基因677C/T SNP研究

陈垚文[1]2017年在《人类肠道宏基因组SNP模式与疾病的关联研究》文中研究指明微生物与人类健康密切相关,它们与宿主之间是一个相互依存、相互作用、不可分割的整体。菌群与宿主之间相互交换能量物质、传递信息,对宿主有营养、免疫、刺激生长和生物拮抗等作用。菌群对人的健康起到至关重要的作用,越来越多的研究报道疾病发生发展与微生物相关。涉及的疾病包括肥胖、糖尿病、肝硬化、各类肠病、中风、自闭症和类风湿关节炎等等。这些研究着重寻找微生物物种和基因在不同样本组中丰度的差异,如2型糖尿病患者的肠道微生物中产丁酸盐细菌丰度下降等。但由于基因序列的不同甚至单个碱基的差别都会导致基因功能的不同,因此宏基因组研究不能仅局限在物种和基因丰度上的分析,还应该关注基因内容的变化,例如单碱基突变、插入删除以及结构变化等。虽然目前已有对宏基因组SNP的初步研究,但与疾病的关联研究还未见报道。如果能在大规模样本下比较分析疾病与健康人群肠道微生物组基因组水平的变化,寻找疾病相关微生物组SNP模式,将对揭示微生物组与人类疾病关系提供全新的视角,为相关疾病的诊断和治疗提供新的依据。据我们所知,目前国际上并没有通过研究宏基因组SNP来探索疾病与微生物关联研究的框架。因此,本研究从宏基因组SNP模式的角度出发,构建了相关分析框架,并将之应用于2型糖尿病和肝硬化的分析。首先我们构建了与疾病关联的宏基因组SNP分析框架。这一框架包括测序数据质量控制、参考基因组构建、序列比对、SNP查找及质量控制、进化树分析、目标物种和基因筛选、多重检验校正、SNP注释、基因注释和富集分析、多克隆分析以及可视化展示。由于宏基因组自身存在微生物物种繁多、样本个体差异大以及已知信息缺乏的特点,我们在各个阶段对数据进行了有针对性的分析和优化。为提高可信度,我们在SNP查找阶段使用SAMTools和VarScan2两个工具,对结果取交集;我们使用不同的突变碱基频率进行了反复分析,同时我们还使用突变碱基频率对样本进行层次聚类和AP聚类,来判定多克隆问题对结果的影响;可视化展示阶段,我们直观的描绘了基因SNP模式在不同组之间的区别,使得对结果的解析更加容易。其次,我们使用构建的框架对2型糖尿病与肠道宏基因组SNP的关系进行了分析。我们下载了170个2型糖尿病患者和174个正常个体的粪便宏基因组测序数据,对数据进行质量控制后,我们使用MetaPhlAn2进行了丰度分析,发现有86个物种在疾病组和正常组中具有显著差异的相对丰度。与之前的报道相吻合,如产丁酸盐细菌在糖尿病组中的缺乏,以及Firmicutes门与Clostridia纲的比例在2型糖尿病患者肠道中比正常个体肠道中更高。为了分析基因组与基因水平SNP的差异,我们在样本集合中找到了356个普遍存在的物种用来做参考基因组,并进行了质控后数据的重新比对。我们发现有20个物种在样本中出现率较高且满足读段覆盖度的条件,其中包括多个Bacteroides属下的物种。在这20个物种中,我们识别到5.94M的可信SNP。Bacteroides coprocola是唯一一个SNP密度在正常组和糖尿病组中存在统计学差异的菌种。进化树分析显示,疾病组和正常组的B.coprocola富集在不同的cluster里。在基因水平,我们找到51579个满足覆盖度和样本出现率的基因。对它们的SNP密度在两组中的差异进行检验,有1300个基因在正常组和糖尿病组中存在差异的SNP模式。通过对偏性SNP的富集分析,我们筛选到65个需重点关注的基因。这65个基因均来自于B.coprocola,且第1名和第6名均为糖基水解酶,提示微生物的糖基水解功能可能在糖尿病发生发展中存在作用。进化树和SNP模式的分析也进一步确定了这些基因在正常组和糖尿病组中的差异。我们还基于MuAF对样本进行了聚类,得到了与之前一致的结果。另外选取MuAF>0.8和MuAF>0.2的SNP重新做了分析,结果仍具有高度一致性。这一分析从多克隆方面对我们的结果进行了支持和验证。最后,我们对肝硬化与肠道宏基因组SNP的关系进行了同样的分析。我们下载了123个肝硬化患者和114个正常人的粪便宏基因组测序数据,在进行数据质量控制之后,我们发现有121个物种的相对丰度在肝硬化组和正常组中存在统计学差异。为了找到在基因组水平的差异,我们使用362个符合条件的微生物物种做为参考基因组并进行了重新比对。进一步筛选后,有13个物种满足覆盖度、测序深度以及样本数等条件。在这13个物种中,我们识别到3.93 M的可信SNP。其中Faecalibacterium cf.prausnitzii KLE1255是唯一一个SNP密度在正常组和肝硬化组中存在统计学差异的菌株。进化树分析显示,疾病组和正常组的Faecalibacterium cf.prausnitzii KLE1255分别在不同的cluster里占优势。在基因水平,我们找到32603个基因满足覆盖度和样本出现率的条件,有1245个基因在正常组和肝硬化组中存在差异的SNP模式。通过对偏性SNP(Biased SNP)的富集分析,筛选到279个需重点关注的基因,全部来自Faecalibacterium cf.prausnitzii KLE1255。我们对这些基因做了功能注释和基因富集,其中前两名分别编码了一种丙酮酸合酶和一种ATP依赖性伴侣蛋白ClpB。进化树和SNP模式的分析也进一步确定了这些基因在正常组和糖尿病组中的差异。在宏基因组领域,我们首次对微生物SNP模式与疾病之间的关联展开研究。我们所构建的框架同时具有高效性和可信度。利用这一框架,我们首次发现Bacteroides coprocola与2型糖尿病、Faecalibacterium cf.prausnitzii KLE1255与肝硬化之间的关联。这些结论为宏基因组学研究开拓了新的方向,为后续的研究提供了新的线索和思路。

胡金伟[2]2014年在《牙鲆抗寒相关基因的差异表达谱及SNP筛选研究》文中指出牙鲆(Paralichthys olivaceus)是重要的海水养殖鱼类,属于温水性鱼类,其最适生长温度为14~23°C。人工养殖条件下,在冬季需要提温才能维持其正常的生长甚至成活,因此,如何提高其低温耐受性受到普遍关注。本研究利用转录组学,初步明确牙鲆耐低温相关基因,并筛选3个主要基因进行克隆和表达分析,还进行了耐低温相关SNP的筛选,以期为阐明牙鲆的耐寒机理以及低温牙鲆选育提供分子基础。具体结果如下:首先,通过预备实验确定了低温胁迫实验的条件,分别获得了低温敏感组和低温耐受组鱼样品,同时设置对照组。对各组鱼样品的组织切片观察发现,低温下牙鲆鳃小片的表皮细胞与血管脱离,鳃丝末端肿大,肌纤维间隙变大。酶活力测定结果显示,丙酮酸激酶活力在低温耐受组中显著高于低温敏感组(P<0.05);低温耐受组中ATP含量显著高于对照组和低温敏感组(P<0.05),低温敏感组的ATP含量最低,均显著低于对照组和低温耐受组(P<0.05)。用Illumina Miseq测序平台对牙鲆低温耐受组、低温敏感组及对照组进行转录组测序,共获得29021个unigenes。按照fold change>2和P-value<0.05筛选差异表达基因。与对照组相比,在低温耐受组中发现了410个上调表达的基因和255个下调表达的基因,在低温敏感组中发现了593个上调表达的基因和289个下调表达的基因。GO和KEGG分析发现低温条件下表达发生变化的基因主要集中在信号转导、脂类代谢、蛋白消化、信号分子互作等过程。通过同源克隆以及5’/3’RACE的方法扩增得到了抗寒相关的CIRP、HMGB1和APO-AIV基因。CIRP的cDNA全长序列共932bp(GenBank登录号:KC735176),HMGB1的cDNA全长序列共1222b(pGenBank登录号:KC422724),APO-AIV的cDNA全长序列共1063bp(GenBank登录号:KC735177)。组织RT-PCR表达谱分析显示,CIRP、HMGB1在脑、鳃、心脏、肌肉、肝脏、肠等组织均有表达,但HMGB-1基因在鳃中表达较弱,而APO-AIV基因有明显的组织特异性:主要在肝脏和肠中表达。低温胁迫实验过程中,3个基因在脑、肌肉、肝脏组织中Real time RT-PCR表达谱结果表明,随着胁迫时间的延长CIRP、HMGB1表达量在肌肉中都出现先上升后下降的趋势:在0~12h逐渐上升并达到最大值,然后下降恢复至最初水平。但在肝脏和脑组织中的变化趋势却不同,HMGB1基因脑中表达量在0~2h上升至最高,然后下降至最初水平,而在肝脏中变化不大。CIRP基因则在肝脏中表达量0~2h处于上升趋势,然后下降至初始水平,在脑中变化不大。APO-AIV在脑和肌肉中先上升,分别在低温处理6h和12h达到最大值,然后下降;肝脏中则先下降后上升。由此,这3个基因在低温条件下可能都参与了机体对外界的抵抗,特别是在抵抗外界低温的主要组织—肌肉中发挥作用,共同参与了机体的免疫反应,对低温胁迫环境下的鱼体进行保护,因此可以作为鱼类耐低温标记筛选的候选基因。本研究还采用PCR直接测序方法筛选了抗寒候选基因CIRP的4个SNP位点和HMGB1基因的2个SNP位点,在牙鲆低温耐受组以及低温敏感组之间存在显著差异(P<0.05),可初步作为耐低温相关的候选分子标记应用于牙鲆耐低温品系的选育。

罗娜[3]2011年在《二穗短柄草耐旱抗氧化机理及其相关基因的SNP研究》文中研究表明二穗短柄草(Brachypodium distachyon L.)是一种冷季型温带禾本科植物,原产于地中海和中东,在中东、北非、亚洲和欧洲广泛分布。目前,二穗短柄草已成为研究谷物、牧草、草坪草和能源草的模式植物。二穗短柄草基因组研究结果为禾本科作物研究奠定了基础,并且人们对二穗短柄草的研究已经取得了很多成果。植物的抗旱性是复杂的数量性状,关联分析是研究基因与复杂的数量性状的基本工具,并且通过直接测序法获得的单核苷酸多态性准确率可以达到100%,结果具有很高的准确性。本研究利用57份二穗短柄草二倍体资源,在温室条件下对其进行抗旱性鉴定;并以抗性材料T-9和最敏感材料B2C为材料,分析干旱胁迫下其与抗旱相关的抗氧系统中抗氧化产物及其酶活性的变化,确定了5个编码抗氧化酶的基因作为候选基因,分析其单核苷酸多态性等;根据57份材料的非变性聚丙烯酰胺胶中POD酶活性染色变化,根据蛋白质谱的结果,确定了8个POD候选基因,对候选基因的核苷酸多态性及与抗旱性状的关联等一系列分析。全文的具体研究结果如下1二穗短柄草的抗旱性鉴定在温室条件下对二穗短柄草抗旱性的自然变异进行鉴定。结果表明,57份二穗短柄草的抗旱性差异很大,根据主成分分析结果分成了4个组,其中抗性组有3份材料,中抗组有16份材料,敏感组有32份材料,最敏感组有6份材料。抗性组表现出很轻微的叶片萎蔫,叶绿素荧光和叶片相对含水量相对于对照降低程度都很小敏感组表现出很严重的叶片萎蔫,并且叶绿素荧光值和叶片相对含水量相对于对照降低程度很大。干旱胁迫明显增加了叶片中总糖的含量,但是各个组之间并没有明显的差异。2二穗短柄草的抗氧化机理在干旱胁迫下抗性材料Tek-9(T-9)和最敏感材料BdTR2C (B2C)叶片中过氧化氢和丙二醛含量增加,根中超氧阴离子含量增加;与抗性材料T-9相比,B2C中的过氧化氢和丙二醛的增加量更多。在叶片中,T-9的谷胱甘肽过氧化物酶(GPX)活性增加,B2C的过氧化氢酶(CAT)和单脱氢抗坏血酸还原酶(MDHAR)活性降低。干旱胁迫也增加了两份材料根中的CAT和MDHAR的活性,并且T-9的增加量多。在T-9根中的GPX、抗坏血酸过氧化物酶(APX)、脱氢抗坏血酸还原酶(DHAR)和谷光甘肽还原酶(GR)的活性也增强了,但是在B2C根中超氧化物歧化酶(SOD)的活性降低。3抗氧化物酶候选基因的单核苷酸多态性分析根据二穗短柄草叶片中抗氧化物酶活性表达稳定或者上调的基因转录水平上的表达情况确定候选基因。候选基因包括编码APX、GPX、CAT、MDHAR和DHAR的基因。其中编码GPX、MDHAR和DHAR的基因转录水平表达情况和干旱胁迫下的酶活性变化一致。编码CAT、GPX、DHAR、MDHAR和APX五个基因的平均核苷酸多态性(π)为0.0027。5个基因的平均单核苷酸多态性(SNP)为每133bp有1个SNP。所有基因的连锁不平衡(LD)衰减范围近于1.6kb。用编码DHAR、MDHAR和CAT基因构建邻近法系统树(Neighbor-joining tree),各个材料的聚类情况和其抗旱情况基本一致。因此这些基因的单核苷酸多态性(SNP)可以作为二穗短柄草的抗旱标记。4过氧化物酶(POD)的单核苷酸多态性及其关联分析通过对二穗短柄草57份材料的POD酶活性染色发现,抗性材料和敏感材料中蛋白条带的位置不一致,就对不同位置的条带进行蛋白的质谱分析,确定了8个POD的候选基因。二穗短柄草的8个POD候选基因扩增测序得到9178bp基因组序列,占总基因序列的56%;序列比较分析后共获得90个SNPs(平均102bp有1个SNP)。编码区长4396bp,共检测到44个SNP(平均100bp有1个SNP)。8个POD基因都符合中性进化。8个PODs候选基因的单倍体,平均单倍型多样性为0.652。8个POD基因的连锁不平衡估算,共获得SNP位点间r2值557个,其中34%(190个)的位点存在显著的连锁不平衡。8个基因总共含有90个SNP,与抗旱生理性状紧密相关联的SNP占总数的30%,其中抗性基因中有21个,占总显著相关联SNP数的70%,而敏感基因中仅有9个与抗旱性状显著相关联,仅占21%。在P=0.05水平上,基因Bradilg63060.1与抗旱性状相关联的SNP数最多,为10个(占这个基因总SNP数的55.6%),其次为抗性基因Bradi3g41340.1,显著关联的SNP数为6个(占这个基因总SNP数60%);其中显著相关联SNP数最少的基因为敏感基因Bradilg26870.1和Bradilg65820.2,占基因总SNP的百分率分别为7.1%和12.5%。因此Bradilg63060.1可以作为抗旱标记及其转基因的基因资源。并且8个POD基因90个SNP结果分析,转换与颠换的比率为1.5:1,因此碱基突变的主要类型为转换。

董玉[4]2015年在《刺参SNP标记的开发及应用》文中研究说明刺参(Apostichopusjaponicus)在分类上隶属棘皮动物门(Holothuroidea)海参纲(Echinodermata)、楯手目(Aspidochirotida),因其巨大的市场价值成为中国重要的海水养殖品种。SNP (Single nucleotide polymorphism),即单核苷酸多态性,作为一种理想的分子标记,以二态性、数目多、易于高通量检出等优点在高密度图谱构建、QTL分析、遗传多样性评估、家系鉴定和分子育种方面得到了广泛的应用。目前,利用EST数据库是开发SNP标记的重要途径。高分辨率熔解曲线(High resolution melting, HRM)是一种高效的突变筛查与基因分型技术,具有简单、精确及闭管操作等优点。本研究利用HRM技术开发刺参EST-SNP标记,并应用于群体遗传多样性分析和生长性状关联的研究,为今后刺参的高密度遗传图谱构建、种群结构分析、生物多样性保护和分子标记辅助育种等遗传学研究提供了基础资料。1.刺参EST-SNP标记的开发从EST数据库中检索到7,739条序列,经过软件进行聚类拼接后得到1,878contigs,筛选得到229个候选SNP位点,通过HRM分析方法,在一个刺参养殖群体中对其进行验证和分型。实验结果表明,有51个候选SNP位点表现出多态性,47个为新开发出的位点;观察杂合度(Ho)和期望杂合度(He)的范围分别为0.0345-0.5000和0.0345-0.5643,平均值分别为0.2405和0.3055。2.刺参中国养殖群体和日本野生群体遗传多样性比较选取已开发的EST-SNP标记中的32个位点,以2个日本野生群体作为参照,运用HRM方法对5个刺参中国养殖群体的群体结构和遗传多样性水平进行分析和比较。结果显示,养殖群体的观测杂合度和期望杂合度与野生群体的没有明显的不同。而群体间两两对比的Fst值(0.0119-0.0236)和遗传一致度(0.9802-0.9915)也并没有明显的区别。对养殖群体和野生群体的AMOVA分析指出,变异的来源在“群体内”。说明了经过长时间的养殖过程,刺参群体的遗传多样性并没有降低,仍然保持着较高的水平。3.刺参SNP标记与生长性状的关联分析选取已开发的EST-SNP标记中的46个位点,利用一个刺参全同胞家系进行了EST-SNP基因型与体长、体宽、体重、体壁重和出肉率性状的关联分析。相关性分析显示,46个SNP位点中有10个位点与生长性状呈显著相关(P<0.05),其中位点SNP183的基因型AB与出肉率显著相关(P<0.05):位点SNP189的基因型AA与体长呈显著相关(P<0.05);8个SNP位点(SNP4、SNP146、SNP154、SNP163、SNP164、SNP175、SNP178和SNP216)的基因型BB与体长、体宽、体重、体壁重性状中的部分或全部呈显著相关,推断基因型BB可能是这些位点的优势基因型。研究结果为刺参经济性状分子标记辅助育种提供了参考资料。

楚鹰[5]2004年在《纤维发育相关基因的SNP研究与棉花蔗糖合酶基因片段的克隆及表达分析》文中提出棉花纤维是纺织工业的重要原料,在国民经济中占有重要地位。优良的纤维品质是世界棉花育种的主要目标之一。因此从分子水平阐明棉纤维发育的机理以及影响纤维品质的主要因素,具有重要的理论价值与现实意义。所以本研究主要在以下两个方面展开: 1.纤维发育相关基因的SNP研究 利用PCR技术分离了七个不同纤维品质的四倍体棉种材料和两个二倍体祖先棉种的纤维发育相关基因片段,共获得了五个棉纤维发育相关基因在九个棉种材料中的序列信息。对不同棉种材料扩增产物的序列分析结果表明,SuSy基因、Expansin基因、LTP基因的四倍体扩增产物能够区分A、D基因组来源,而ACP基因与FbL2A基因的四倍体扩增产物不能够区分A、D基因组来源。 利用能够区分四倍体扩增产物A、D基因组来源的基因片段,分别对A、D基因组的SNPs数目进行了统计并估算了A、D基因组的SNPs频率。A基因组的频率为0.0055,D基因组的频率为0.0082。 对陆地棉高强纤维品系间的SNPs位点进行了统计,发现有四个cSNPs位点中存在非同义突变,可能具有表型效应。 2.棉花蔗糖合酶基因片段的克隆与表达分析 在一条棉纤维cDNA部分序列的基础上,利用TAIL-PCR方法从基因组中获得了一条新的棉花蔗糖合酶基因的5’端基因组DNA序列。该基因组片段长2.9 kb,包含有起始外显子在内的八个完整的外显子序列和八个内含子序列。BLAST结果表明该基因与柑桔蔗糖合酶基因具有较高的同源性,将其命名为GhSUSA1。RT-PCR结果表明GhSUSA1基因在纤维发育过程中表达量逐渐增加,开花后十七天达到最高;而在根、下胚轴、叶片中也有表达,但表达量没有纤维细胞中高。这说明GhSUSA1可能是受纤维发育过程调控的纤维优势表达基因。

王俊[6]2013年在《枇杷(Eriobotrya japonica Lindl.)SNP位点筛选及遗传多样性分析》文中研究指明枇杷(Eriobotiya japonica Lindl.)为蔷薇科枇杷属常绿果树,其果实于春末夏初成熟,酸甜适口,深受人们的喜爱,乃果中佳品。目前生产中广泛栽培的枇杷品种,其果肉较薄,果实大多含有3粒以上的种子,可食率较低,且不利于果品加工。本研究所在团队率先选育出的天然三倍体无籽枇杷在可食率和加工性方面均优于现有品种,具有极高的生产价值。近年来,已开展了大量生物学性状调查和遗传学研究,并从现有三倍体枇杷群体中筛选出了一批大果、无核、优质的单株。本研究针对部分大五星和龙泉1号三倍体不同单株及其二倍体(46份)的候选基因进行单核苷酸多态性分析,通过检测到的位点对不同单株枇杷种质之间的遗传多样性进行评估。并利用龙泉1号二倍体及其三倍体单株B355进行转录组测序,筛选其中存在的SNP,旨在为天然三倍体枇杷新品种审定、育性和果实品质调控研究奠定基础。本研究的主要结果如下1、根据GeneBank中已登记的枇杷基因序列设计特异引物,从设计的20对引物中筛选出7对扩增条带特异,且测序结果具有核苷酸位点差异的引物进行研究。2、对7个基因进行克隆测序,将每个基因片段的所有测序结果进行序列比对,从46份供试材料中发现SNP位点385个。其中CCoMoAT基因有15个SNP位点,DXS基因84个SNP位点,HSP70基因38个SNP位点,IDI基因48个SNP位点,S6PDH基因27个SNP位点,matK基因7个SNP位点,squalene epoxidase2基因168个SNP位点。按照类型划分,转换型SNP位点241个,颠换型SNP位点144个,转换型SNP位点明显多于颠换型,且各供试材料的SNP位点突变不完全相同。3、应用DnaSP软件进行统计分析,CCoAoMT基因、DXS基因、HSP70基因、IDI基因、S6PDH基因、matK基因和squalene epoxidase2基因的Hd分别为0.486、0.973、0.918、0.548、0.767、0.324和0.947,表明CCoAoMT基因、IDI基因和matK基因的遗传多样性一般,DXS基因、HSP70基因、S6PDH基因和squalene epoxidase2基因的遗传多样性高。CCoAoMT基因、IDI基因、S6PDH基因、matK基因、squalene epoxidase2基因的P<0.02,说明不同枇杷材料之间此基因有很大的差异,DXS基因的P<0.05,说明不同枇杷材料之间此基因的差异不明显,HSP70基因的P>0.10,说明不同枇杷材料之间此基因的差异不明显。4、SNP聚类结果显示,46个材料共划分为3个类群,大部分的龙泉1号和大五星三倍体材料在第1大类,靴带支持率为100%,少部分的龙泉1号三倍体、大五星三倍体和对应的二倍体都被分在了第Ⅱ和第Ⅲ大类,靴带支持率分别为92%和99%。其中B347在第Ⅱ大类中被单独区分开,另外,A332和B335、B349和A376、B329和A313、B414和A430都被分在了一起,节点支持率分别为93%、88%、47%、97%。A2和B352聚为一支,节点支持率为93%,B2和B338聚为一支,节点支持率为99%。A348、B356、B350、B373、B378、B336、B341、B242、B372、A379、B353、B357和B369能与其它三倍体单株分离开,这说明不同单株之间存在着较为丰富遗传多样性,能够利用筛选出的SNP标记进行遗传多样性分析。5、对龙泉1号二倍体及其三倍体单株B355的转录组测序结果进行分析筛选SNP位点,最终在龙泉1号二倍体中得到115383个SNP位点,其中转换类型的SNP位点72056个,占总数的62.45%;颠换类型的SNP位点43327个,占总数的37.55%。三倍体单株中得到121451个SNP位点,其中转换类型的SNP位点75966个,占总数的62.55%;颠换类型的SNP位点45485个,占总数的37.45%。统计数据显示,转换发生的概率接近颠换的2倍,而嘧啶间突变和嘌呤间突变的比例相差不大。腺嘌呤与胸腺嘧啶突变发生的比例相对较高,胞嘧啶与鸟嘌呤突变发生的比例相对较低,但差异并不显著。

江宠颐[7]2014年在《苔海绵和叶片山海绵转录组的拼接、注释和分子标记挖掘》文中认为作为最原始的多细胞生物,海绵(多孔动物门,Porifera)已经在地球上生存了至少6亿年。自出现以来,海绵一直在生态系统方面扮演重要角色。近年来,海绵作为具有生物活性海洋天然产物的主要来源得到了广泛研究。此外,海绵骨针的特性及其生长机制和生物矿化过程也是研究热点。人们普遍认为海绵是现存最古老的多细胞种系,因此它在多细胞分化研究中的地位举足轻重。虽然海绵可被利用的价值如此之高,但是关于海绵的基础研究依然非常薄弱。随着测序技术的迅猛发展,转录组作为一种有力的研究手段,已被广泛地运用到数以千计个物种的研究中。目前关于海绵转录组的研究有两篇报道,它们关注的焦点均是找出一批与海绵生活史相关的基因。转录组不仅可以用来获取反映特定生理状态的基因,还可用于开发新的分子标记。单核苷酸多态性(Single Nucleotide Polymorphism, SNP)是指在DNA序列上,同一位点的不同等位基因之间核苷酸的差异,属于第三代DNA分子标记。通过分析编码序列区域的SNP,可以计算非同义替代率与同义替代率的比值(SNP A/S),进而研究物种的功能基因的选择压力。本研究利用Illumina Hiseq2000对苔海绵和叶片山海绵的转录组进行高通量测序,并对这两个转录组进行从头拼接。得到两种海绵的unigene后,利用SwissProt蛋白数据库和大堡礁海绵蛋白数据库对转录组进行基因注释,并用GO条目进行功能注释。通过GO注释,本文比较了苔海绵、叶片山海绵、大堡礁海绵和地中海海绵转录组在生化过程、分子功能和细胞组分三方面的异同。从GO条目种类及每个条目的相对比例来看,四种海绵转录组的组成和结构彼此相近。此外,本文还利用这4种海绵的转录组挖掘出36个直系同源基因。根据基因注释分析,这些同源基因可被细分成8大类。直系同源基因可被进一步开发成为新的分子标记,用于寻常海绵纲海绵的分类鉴定。最后,本研究通过对苔海绵和叶片山海绵基因编码区的SNP分析,得到一批受到分歧选择的基因,并比较了不同GO功能条目下的基因的进化速率。为比较不同环境对海绵基因的选择作用,本研究还分析了生活在地中海西部海域的地中海海绵转录组的SNP及SNP A/S。三种海绵中,叶片山海绵的SNP密度最大,地中海海绵的SNP密度最小,推测叶片山海绵的本地群体更大或形成时间更长。地中海海绵的平均SNPA/S大于苔海绵和叶片山海绵,说明地中海海绵受到的纯化选择压比另外两种海绵小。苔海绵和叶片山海绵的平均SNPA/S相近,这可能是因为这两种海绵生态位相近,受到的选择压相近。在三种海绵SNP A/S大于1的基因中均发现与免疫相关的基因。在苔海绵SNPA/S大于1的基因中发现8个来自病毒的序列。在三种海绵受到正选择压的基因中,约有1/3的序列与多细胞化基因相关。本研究首次实现不同海绵在转录组水平上的比较以及大规模的海绵SNP分析。本研究利用SNPA/S揭示海绵功能基因的进化历程,为后续研究海绵的分子进化和分子遗传学等研究奠定了基础。

刘钟芬[8]2016年在《肿瘤家族史和乳腺癌的关系研究及乳腺癌相关单核苷酸多态性的文献回顾》文中进行了进一步梳理目的:第一部分:通过回顾性分析临床资料,统计分析肿瘤家族史背景和乳腺癌的各项临床、病理指标的关系,得出具有乳腺癌家族史、其他肿瘤家族史或无肿瘤家族史的乳腺癌患者的临床、病理表现特征。第二部分:通过中英文的文献回顾,总结以往中国人群中进行的与乳腺癌相关的多种基因的单核苷酸多态性(Single nucleotide polymorphisms, SNP)研究,为乳腺癌的遗传学研究和基因组研究提供线索。方法:第一部分研究通过在武汉大学人民医院的电子病历库和纸质病例库搜索获得2009年~2012年临床、病理资料较全的乳腺癌病例的临床资料,使用spss软件对患者的临床、病理资料进行分类统计。第二部分通过在Pubmed、CNKI数据库检索文献,搜集以往中国人群和乳腺癌相关的主要基因的SNP研究报道,并进行文献回顾。结果:第一部分研究共纳入356例湖北省内的乳腺癌患者。284例无肿瘤家族史,72例有乳腺癌家族史或者其他肿瘤家族史,11例有乳腺癌家族史,61例有其他肿瘤家族史。1位1级亲属患乳腺癌的比例为9.0%,1位2级亲属或其他亲属患乳腺癌2.0%,多位亲属患乳腺癌的比例是0.0%,多位亲属患其他肿瘤的比例为4.0%,1位亲属患其他肿瘤的比例为16.0%。45岁以下发病的患者占69.9%,46岁及以上发病的患者占30.1%。初潮年龄≤12岁的患者占10.4%,初潮年龄>12岁的占87.1%。未绝经的患者占比例51.4%,已绝经的占46.9%。多灶发病情况:非多灶发病占91.9%,多灶发病占8.1%。生育次数0~1次的患者55.9%,生育≥2次的患者有37.9%。>2cm的占45.8%,≤2cm的占40.2%。浸润性导管癌Ⅰ~Ⅱ级占36.0%,Ⅲ级占38.8%,非浸润性导管癌的比例为24.7%。导管癌的比例93.5%,其他癌的比例6.5%。Luminal A型的比例31.5%,Luminal B型的比例38.8%,Her-2型的比例12.1%,三阴型9.8%。改良根治术86.2%,保乳术5.3%,单纯切除术占2.5%,局部扩大切除术1.7%,仅活检或未手术的占4.2%。无淋巴结转移的44.9%,1~3枚占19.1%,4~9枚的比例为16.9%,>9的比例占9.8%。比较无肿瘤家族史和有肿瘤家族史患者的各因素发现,分子分型差异有统计学意义(P<0.05),年龄、初潮年龄、是否绝经、生育次数、是否多灶、肿瘤大小、病理类型、病理分级、手术方式、淋巴结转移数目等差异均无统计学意义(P>0.05)。对分子分型分组进行两两比较,并根据比较的次数调整检验水准,发现Her-2型乳腺癌相比Luminal A型乳腺癌,有肿瘤家族史的患者的比例更高,差异有统计学意义(P=0.000<0.005),Her-2型乳腺癌相比Luminal B型乳腺癌,有肿瘤家族史的患者的比例更高,差异有统计学意义(P=0.003<0.005),三阴型乳腺癌相比Luminal A型乳腺癌,有肿瘤家族史的患者的比例更高,差异有统计学意义(P=0.000<0.005),其余分子分型组间差异无统计学意义(P>0.005)。比较无肿瘤家族史的乳腺癌患者、家族性乳腺癌、有其他肿瘤家族史的乳腺癌患者各因素发现,分子分型差异有统计学意义(P<0.05),年龄、初潮年龄、是否绝经、生育次数、是否多灶、肿瘤大小、病理类型、病理分级、手术方式、淋巴结转移数目等差异均无统计学意义(P>0.05)。对分子分型分组进行两两比较,并根据比较的次数调整检验水准,发现Her-2型相比Luminal A型乳腺癌,其他肿瘤家族史的比例更高,差异有统计学意义(P=0.000<0.002),其余分子分型分组之间差异无统计学意义(P>0.002)。第二部分文献回顾总结了近几年中国人群中发现的主要乳腺癌相关SNP研究,其中包含较多国外未报道过的SNP,这些SNP位点的基因型和乳腺癌的发病、进展以及临床特点等具有相关性。结论:湖北省乳腺癌患者中,肿瘤家族史背景和乳腺癌的分子分型相关,而与其他因素无显著相关性。Her-2型、三阴型乳腺癌有肿瘤家族史的患者的比例更高,而Luminal A型、Luminal B型有肿瘤家族史的患者比例较低。HER2型有其他肿瘤家族史的比例较高而Luminal A型有其他肿瘤家族史的比例较低。BRCA1和BRCA2、DNA修复、肿瘤增殖及转移等相关基因中,具有显著差异的SNP位点可以逐步纳入中国女性普查,评估妇女罹患乳腺癌发病风险。

张玮[9]2007年在《玉米Dwarf8基因早开花功能性位点初步关联性分析》文中提出玉米(Zea mays L.)是世界上重要的粮食、饲料与工业原料作物。早熟不仅缩短了生育期,而且是一种优良的综合抗逆性状。玉米早开花期相关的调控基因是玉米早熟与矮杆等性状的主要决定因子。研究Dwarf8基因是与开花期和株高相关联的功能性位点,并开发成相关性状的功能标记,可实现这些性状的分子标记辅助选择育种,具有重要的研究意义。本研究以160个国内玉米生产上重要的自交系为材料,于海南(冬)、北京(春)、黑龙江(春)三地分别进行了表型鉴定试验,以玉米基因组均匀分布的70个位点的SSR数据分析了它们的群体结构,并对Dwarf8基因的功能位点进行基因分型分析,联合群体结构、Dwarf8基因型与三环境表型数据进行了初步的关联性分析,结果表明:1.160个玉米自交系的表型多态性分析和海南、北京和黑龙江三个显著差异的生态环境下对开花期、株高、穗位高表型鉴定,表明供试材料开花期等性状具有丰富的表型变异和生态差异性,此批材料适于做开花期等性状的关联性分析。2.利用前人在此批材料上的70个位点的SSR分析数据进行了供试材料的群体结构分析,把它们分为PA(美国杂交种选系A群)、Reid、PB(美国杂交种选系B群)、Lancaster、旅大红骨与四平头6个亚群,并获得了每个自交系的基因组来源于各亚群种质的比例与组成的数据(Q-matrix),为关联性分析奠定了分析基础。3.建立了等位基因特异性PCR的技术等检测SNP位点的实验技术体系,利用该体系对160个国内外玉米自交系Dwarf8基因中的5个功能性位点进行了SNP基因分型。4.联合群体结构数据、Dwarf8基因型与表型数据进行初步关联性分析,结果表明:702位点缺失阴性与1664位点T基因型存在较强的连锁不平衡(D'=0.86,r~2=0.92),与早开花性状高度相关。Del702阴性与1664T可以开发成为早开花与早熟标记应用于分子育种。

王强[10]2017年在《乙酰胆碱受体基因及其它因素与戒烟成功关系的研究》文中指出研究背景虽然吸烟是一种可防可控的行为,世界各国也做了大量工作去控制烟草的流行,但是烟草在全球的流行趋势并不容乐观。2011年全球范围内15岁以上群体中,吸烟比例男性为36%、女性为8%。全球的统计结果显示,吸烟每年给人类社会造成了大约35000亿人民币的经济损失;每年因吸烟导致疾病所引起的死亡人数约有600万。在中国,2011年15岁以上人群中的吸烟比例男性为47%、女性为2%。在中国,有3亿个体正处于吸烟的状态中,处在二手烟危害中的非吸烟个体有7.4亿之多。然而在中国2年以上的成功戒烟率仅为11.70%。烟草烟雾中的化学物超过4000种,很多种化学物是有毒有害的,其中有69种化学物是被确定的致癌物。吸烟几乎可以危害到人的全部器官,导致一系列癌症的发病率升高,是支气管哮喘、脑卒中、动脉粥样硬化等非传染性慢性病的诱因。吸烟已成为全球前八位死亡原因中六种疾病的主要致病因子。戒烟是文献中可见到经证明过的降低、杜绝烟草损害的唯一方法。因此,探索戒烟成功的影响因素,为针对性制定戒烟干预措施提供理论支持,成了公共卫生工作者需要解决的一个问题。持续吸烟的主要原因是吸烟者产生了尼古丁依赖。尼古丁依赖是由烟草烟雾中的尼古丁造成的。烟草烟雾中的尼古丁被吸入人体经呼吸系统、循环系统到达脑部后,首先与烟碱型乙酰胆碱受体(nicotinic acetylcholine receptors,nAChRs)结合,然后刺激中脑边缘系统的多巴胺神经元合成多巴胺,最后导致伏隔核区的多巴胺释放增多,使人产生"愉悦感",完成物质奖赏过程。这是尼古丁依赖的生物学机制。尼古丁发挥作用的第一步是尼古丁与nAChRs的结合。烟碱型乙酰胆碱受体基因(nicotinic acetylcholine receptor gene,CHRN)起着调节烟碱型乙酰胆碱受体的作用。基因敲除模型研究表明,敲除了 CHRN的小鼠对尼古丁的某些反应发生了改变。戒烟与尼古丁依赖是相对立的:戒烟成功、放弃吸烟的关键一步就是要克服尼古丁依赖。因此我们推测CHRN可能对尼古丁依赖、戒烟成功有影响。人群研究表明,CHRN的单核苷酸多态性(singlenucleotide polymorphisms,SNP)突变可以降低戒烟成功的可能性、使安慰剂组戒烟率降低、使个体的主动戒烟次数出现差异。虽然现有的研究揭示了 CHRN与戒烟成功的某些关系,但这些研究尚存在着不足之处:第一,用单个SNP去研究基因变异与戒烟成功的关系有可能不能检测到基因变异对戒烟成功的全部影响;第二,当前的文献中,存在结果不一致或者结果相反的情况。第三,现有研究缺乏用整体基因信息从基因层面上去研究CHRN与戒烟成功关系的案例。研究表明,个体因素(如年龄、职业、教育、每天吸烟量、吸烟开始年龄、吸烟年数、戒烟动机等)与戒烟成功相关。尼古丁依赖不仅仅意味着躯体依赖也意味着心理依赖。诸多心理因素中,自我效能代表了人在一定的情景中解决问题的自信。Bandura的理论表明,具有较高自我效能的个体戒烟成功的机率相对较大。研究也显示,曾经吸烟者的拒烟自我效能(smoking abstinence self-efficacy,SASE)得分比现在吸烟者的SASE得分高。自我效能与尼古丁依赖之间存在着负向相关关联。据此推断SASE可能在成功戒烟中起着积极的作用。现有的戒烟成功影响因素的探讨大多数都是基于"单因素(基因)或多因素(基因)效应独立"的统计假设,数据分析采用的是基于变量间效应独立的统计方法。这种研究设计和统计分析适用于单因素或效应独立的多因素情况。就尼古丁依赖、成功戒烟这类多因子疾病而言,通常是由多个因素(基因)组成了一个复杂的交互网络系统。基于效应独立的统计方法,缺乏针对由多个因素(基因)所构成的交互网络的系统推断,因而难以从系统层面阐述戒烟成功的机理。现有研究中,多将个体因素、心理因素作为协变量纳入对遗传因素和戒烟关系的研究中。虽然这些研究揭示了遗传因素、个体因素、心理因素都对戒烟成功有影响,但未能揭示这三类因素对戒烟成功贡献的相对大小。根据目前研究的现状和不足,本研究拟进行社区为基础的病例对照研究,以成功戒烟者为病例组、以不成功戒烟者为对照组,采用综合基因变异整体信息的基因分数从基因层面去研究CHRN变异与戒烟成功之间的关系,并辨析遗传因素、个体因素、心理因素在戒烟成功中的作用。研究目的1.用综合了基因变异整体信息的基因分数研究遗传因素与戒烟成功的关系;2.探索遗传因素、个体因素、心理因素在戒烟成功中的相互作用;3.比较遗传因素、个体因素、心理因素对戒烟成功贡献的相对大小。研究方法1.采用社区为基础的病例对照研究,病例组由成功戒烟者组成、对照组由不成功戒烟者组成。调查对象来自于山东省3个县的17个村庄。采用调查问卷调查吸烟者的个体因素、心理因素资料。从调查对象的血液样品中提取DNA,并进行基因分型,获取吸烟者的遗传因素资料。2.采用T检验、秩和检验、卡方检验比较个体因素、心理因素在成功戒烟人群和不成功戒烟人群之间的分布差别。用单因素Logistic回归分析、多因素Logistic回归分析探索单个SNP位点、基因分数与戒烟成功的关系。用卡方检验探索单体型与戒烟成功的关系。3.用贝叶斯网络模型构建遗传因素、个体因素、心理因素对戒烟成功产生作用的交互网络,分析遗传因素、个体因素、心理因素对戒烟成功产生作用过程中的相互作用。4.采用Logistic回归预测为基础的优势分析比较遗传因素、个体因素、心理因素对戒烟成功的相对作用大小。研究结果1.年龄、戒烟时年龄、吸烟年数在成功戒烟人群和不成功戒烟人群之间的分布存在统计学差别(P<0.05):成功戒烟人群的平均年龄高于不成功戒烟人群的平均年龄,成功戒烟人群戒烟时的平均年龄低于不成功戒烟人群戒烟时的平均年龄,成功戒烟人群的平均吸烟年数少于不成功戒烟人群平均吸烟年数。吸烟开始年龄、每天吸烟量、工作、教育水平、戒烟原因在成功戒烟人群与不成功戒烟人群之间的分布无差别(P>0.05)。积极情境的拒烟自我效能(smoking abstinence self-efficacy in positive/social situation,SASEP)、消极情境的拒烟自我效能(smoking abstinence self-efficacy innegative/affective situation,SASEN)、习惯情境的拒烟自我效能(smoking abstinence self-efficacy in habit/addictive situation,SASEH)、拒烟自我效能总得分(smoking abstinence self-efficacy total score,SASET)都呈现出成功戒烟人群的平均分数高于不成功戒烟人群平均分数的趋势;SASEN、SASET在成功戒烟人群与不成功戒烟人群之间的分布存在统计学差别(P<0.05)。多因素 Logistic 回归分析显示,位点 rs578776(CHRNA3)、rs660652(CHRNA3)、rs588765(CHRNA5)与戒烟成功存在显著性关系(P<0.05)。位点rs578776的C等位基因(OR值为0.77)、位点rs660652的A等位基因(OR值为0.70)、位点rs588765的T等位基因(OR值为0.73)是戒烟成功的危险因素。单体型分析结果显示,CHRNA3、CHRNB4分别有一个单体型与戒烟成功相关(P<0.05)。CHRNA3中的单体型ACC在成功戒烟人群中出现的频率低于它在不成功戒烟人群中出现的频率;而CHRNB4中的单体型GGG在成功戒烟人群中出现的频率高于它在不成功戒烟人群中出现的频率。多因素Logistic回归分析显示基因分数CHRNA3与戒烟成功存在显著性关系(P<0.05)。基因分数CHRNA3为戒烟成功的危险因素(OR值为0.48)。2.本研究构建的贝叶斯网络的受试者工作特征曲线下面积为0.91,能够较好的预测结局变量。遗传因素、个体因素、心理因素在影响戒烟成功的过程中形成了5条主要的影响通路:①年龄→戒烟原因→戒烟成功,②年龄→戒烟时年龄→吸烟年数→戒烟成功,③吸烟开始年龄→吸烟年数→戒烟成功,④每天吸烟量→SASET→戒烟成功⑤CHRNA3→ CHRNA5→ CHRNB4→戒烟成功。年龄可以通过戒烟原因、戒烟时年龄、吸烟年数等变量间接影响戒烟成功。吸烟年数是影响戒烟成功的一个关键节点。每天吸烟量可以通过影响SASET间接影响戒烟成功。CHRNA3对CHRNA5、CHRNB4在戒烟成功这一结局变量上有影响。3.优势分析显示,个体因素是戒烟成功的首要影响因素(标准化权重52.22%,重要性排序为1),其后依次为遗传因素(标准化权重28.85%,重要性排序为2)、心理因素(标准化权重18.93%,重要性排序为3)。主要结论1.个体因素是戒烟成功的影响因素,年龄、戒烟时年龄、吸烟年数在成功戒烟人群和不成功戒烟人群中的分布不同。心理因素是戒烟成功的影响因素,SASE水平越高的个体成功戒烟的机率就越大。遗传因素是戒烟成功的影响因素,CHRNA3是戒烟成功的危险因素,CHRNA3基因分数越高越难戒烟。2.个体因素之间、个体因素与心理因素之间、遗传因素之间在对戒烟成功的影响过程中存在依赖关系。在戒烟干预中,通过干预关键节点,来提高预定目标人群的戒烟率。3.个体因素是戒烟成功的首要影响因素,个体因素对戒烟成功的作用要大于遗传因素的作用。戒烟干预中,应加强对个体因素的关注,纠正吸烟者将戒烟不成功归结为遗传因素的错误观念。创新点1.本研究借助基因分数用整体基因信息反映基因效应,从基因层面上揭示了CHRNA3是戒烟成功的影响因素,避免了单个SNP研究的某些不足,提高了检验效能。2.以影响戒烟成功的乙酰胆碱受体基因为基础,借助贝叶斯网络模型,从系统层面上探索遗传因素、个体因素、心理因素对戒烟成功的影响以及各种因素之间的相互关系。3.通过优势分析,辨析遗传因素、个体因素、心理因素对戒烟成功作用的相对大小,确定了个体因素是戒烟成功的首要影响因素,为戒烟干预确定优先干预措施提供了理论基础。

参考文献:

[1]. 人类肠道宏基因组SNP模式与疾病的关联研究[D]. 陈垚文. 中国人民解放军军事医学科学院. 2017

[2]. 牙鲆抗寒相关基因的差异表达谱及SNP筛选研究[D]. 胡金伟. 中国科学院研究生院(海洋研究所). 2014

[3]. 二穗短柄草耐旱抗氧化机理及其相关基因的SNP研究[D]. 罗娜. 南京农业大学. 2011

[4]. 刺参SNP标记的开发及应用[D]. 董玉. 中国海洋大学. 2015

[5]. 纤维发育相关基因的SNP研究与棉花蔗糖合酶基因片段的克隆及表达分析[D]. 楚鹰. 南京农业大学. 2004

[6]. 枇杷(Eriobotrya japonica Lindl.)SNP位点筛选及遗传多样性分析[D]. 王俊. 西南大学. 2013

[7]. 苔海绵和叶片山海绵转录组的拼接、注释和分子标记挖掘[D]. 江宠颐. 厦门大学. 2014

[8]. 肿瘤家族史和乳腺癌的关系研究及乳腺癌相关单核苷酸多态性的文献回顾[D]. 刘钟芬. 武汉大学. 2016

[9]. 玉米Dwarf8基因早开花功能性位点初步关联性分析[D]. 张玮. 安徽农业大学. 2007

[10]. 乙酰胆碱受体基因及其它因素与戒烟成功关系的研究[D]. 王强. 山东大学. 2017

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

LDL受体基因1972T/C SNP及MTHFR基因677C/T SNP研究
下载Doc文档

猜你喜欢