DNA序列相关性结构研究综述及人类基因组序列相关性分析

DNA序列相关性结构研究综述及人类基因组序列相关性分析

刘劲松[1]2001年在《DNA序列相关性结构研究综述及人类基因组序列相关性分析》文中研究说明本文对DNA序列相关性结构方面的研究进行了回顾,并对一组人类基因组序列进行了宏观的相关性分析。主要内容有叁个方面:DNA序列相关性结构的描述,包括相关函数的各种概率估计,传统的谱分析方法,较新的DNA步的分析方法和改进的DFA方法;利用熵函数研究DNA序列的不均一性和复杂性,大量的数值实验证明其和DNA序列中的长程相关性有关;DNA序列长程相关性的可能的起源,主要包括插入—删除模型和变异—复制模型研究长程相关性的起源。

李鹤遥[2]2010年在《精神分裂症相关SNPs位点的病例—对照与家系合并样本的关联性研究》文中研究指明精神分裂症(schizophrenia)是一种严重危害人类心灵健康的常见精神疾病,多起病于青壮年,常有特殊的思维、知觉、情感和行为等多方面的障碍和精神活动与环境的不协调,精神活动丧失了统一性、完整性,严重损害患者的社会适应能力。一般无智能障碍,多数病程迁延。患者劳动能力显着丧失,给社会和家庭造成长期沉重的负担,并占用大量医疗卫生资源,其对社会经济负担居各种疾病前列。同时,由于患者的社会功能的丧失以及法律行为能力的丧失,也给社会的安定带来了不利因素。该病的病因及发病机制目前尚不清楚。通过家系、双生子以及寄养子研究都证明了遗传因素在精神分裂症的发病中起着重要的作用。至今,对精神分裂症的候选基因研究,已经获得了不少阳性结果,但重复性较差。而对于导致精神分裂症的主要的、特异性的易感基因的研究,还没有获得理想的结果。本研究以371个精神分裂症核心家系、950名患者、1095名与患者无血缘关系对照为研究对象,并将研究对象分为家系样本、普通病例对照样本以及家系与普通病例对照整合样本叁组,在4个候选基因(PLA2G4A、TNXB、KPNB3、PEMT)上选择了4个SNPs遗传标记(rs10798059、rs204887、rs626716、rs4646396),利用PCR-RELP方法确定个体等位基因和基因型。应用关联分析方法和多功能遗传统计学软件(SPSS、UNPHASED)分别分析数据。各SNPs在各组中与精神分裂症的相关性分写结果显示,KPNB3基因和PEMT基因在家系样本和整合样本中与精神分裂症发病密切相关。分别以阳性基因位点,即KPNB3基因的rs626716位点和PEMT基因的rs4646396位点作为条件基因,与本研究的其他基因进行基因基因相互作用分析结果显示,在整合样本中,rs626716位点T/T等位基因与rs4646396位点T/T基因型之间的相互作用,可能极大的提高个体对精神分裂症的易感性。各SNPs与精神分裂症的临床症状分析结果显示,rs10798059位点、rs204887位点、rs4646396位点在总体样本和女性样本中与精神分裂症阳性症状相关;rs10798059位点,rs626716位点,rs4646396位点在男性样本中与精神分裂症相关。rs204887位点与精神分裂症阴性临床症状中的意志缺乏相关。本研究中的四个SNPs位点与精神分裂症患者临床分型和病前人格的分析结果显示均为阴性。这些结果提示,KPNB3基因和PEMT基因可能是与精神分裂症的易感基因,并在这两个基因基因相互过程中,会极大的提高精神分裂症的易感性。本研究的四个基因位点均与精神分裂症患者中的某些临床症状相关联,但是与病前人格和临床分型相关联。本研究工作是后基因组时期疾病基因组研究的热点课题。所获得的结果不仅有助于深入阐述精神分裂症的分子遗传机制,而且还为疾病预测、临床诊断、基因治疗以及药物开发奠定了基础。

张海英[3]2007年在《精神分裂症易感基因的遗传学研究》文中研究表明精神分裂症是以基本个性改变,思维、情感、行为的分裂,精神活动与环境不协调为主要特征的一类最常见的精神病。多在青春期后期和成年早期发病,患者劳动能力显着丧失,给社会和家庭造成长期沉重的负担,并占用大量医疗卫生资源,所造成的社会经济负担居各种疾病前列。经典遗传学通过家系调查、双生子和寄养子等流行病学研究及分子遗传学前瞻性研究已经证实,精神分裂症是一种多基因遗传疾病,但对其易感基因的定位仍不明确。随着分子生物学技术和遗传学数据分析方法的进步,精神分裂症的分子遗传学研究已进入一个新的发展时期。本研究以270个中国汉族精神分裂症患者及其健康父母双亲组成的核心家系以及537例无血缘关系的精神分裂症患者和690例健康者为研究对象,利用生物信息学方法及分子遗传学技术,在13q14.3和17p11.2区域内,筛查精神分裂症的易感基因位点。实验选择KPNA3基因及PEMT基因上的5个SNPs遗传标记,利用PCR-RFLP方法确定个体基因型。应用基于家系的连锁不平衡分析方法(TDT及HHRR)、基于群体的Case-Control相关分析方法以及多功能遗传统计学软件(SPSS14.0和UNPHASED2.404)分析数据。结果显示,KPNA3基因和PEMT基因均与中国汉族人群精神分裂症发病密切相关。KPNA3基因的SNP3位点G/A等位基因和PEMT基因的SNP4位点C/T等位基因可能是精神分裂症的易感突变位点。含有SNP3 (G)的单倍型和SNP4 (C)的单倍型可能提高个体对精神分裂症的易感性。各SNPs与精神分裂症的临床症状相关性分析结果显示,SNP3、SNP4和SNP5位点分别与精神分裂症的某些阳性症状相关联。SNPs与精神分裂症性别相关性分析显示,SNP2位点的G等位基因、SNP3位点的G等位基因及SNP4的C等位基因与男性精神分裂症发病密切相关,表明精神分裂症在男女之间存在遗传异质性。上述结果提示,KPNA3基因及PEMT基因可能是精神分裂症的易感基因,13q14.3和17p11.2区域可能存在多个决定精神分裂症的易感性或抗性的突变位点。这些位点可能位于同一基因,即等位基因异质性;也可能位于不同基因,即位点异质性。本工作是后基因组时期功能基因组学研究的前沿课题,所获结果将有助于阐明精神分裂症的分子遗传学机制,为实现在基因水平上预测疾病,提高社会保健水平,探索疾病诊断与防治方法,开发设计新型药物奠定了坚实的理论及实验基础。

叶琳[4]2006年在《人类染色体22q11-12区域精神分裂症相关基因的遗传学研究》文中提出精神分裂症是一种以基本个性改变,思维、情感和行为的分裂、精神活动与环境不协调为主要特征的精神疾患,属于人类复杂疾病。该病的发生涉及遗传和环境因素的共同作用。国内外的学者在精神分裂症易感基因的筛查和定位研究中已获得了一定有价值的结果,但是由于精神分裂症是复杂的多基因遗传性疾病,其易感基因的数量、各基因的致病风险度以及致病机制仍未被阐明。确定精神分裂症的病因,在基因水平上预防和治疗疾病是当前医学研究中的重大课题。本研究以296个中国汉族精神分裂症患者及其健康父母双亲组成的核心家系以及400例无血缘关系的精神分裂症患者和419例健康者为研究对象,利用生物信息学方法和分子遗传学技术在22q11-12构建单核苷酸多态性(SNPs)连锁不平衡图,通过检测该染色体区域候选基因上的SNPs,筛检与精神分裂症相关联的基因位点。在5个候选基因(PRODH、UFD1L、CLDN5、APOL1和APOL3)上选择6个SNPs遗传标记,利用PCR-RFLP方法确定个体基因型。应用基于家系的连锁不平衡分析方法(TDT及HHRR)和基于群体的case-control相关分析方法以及多功能遗传统计学软件(SPSS11.5和UNPHASED2.404)分析数据。结果显示,UFD1L基因和CLDN5基因均与中国汉族人群精神分裂症发病密切相关,UFD1L基因的SNP2 C/G等位基因和CLDN5基因的SNP4 C/G等位基因与精神分裂症易感基因既连锁又关联。含SNP2(C)的单倍型和含SNP4(C)的单倍型可能携带精神分裂症抗性位点。含SNP4(G)的单倍型可能携带精神分裂症易感位点。各SNPs与精神分裂症的临床症状相关性分析结果显示,SNP3、SNP4和SNP6位点分别与精神分裂症的某些阳性症状相关联,SNP4位点与精神分裂症的阴性症状思维贫乏相关联。SNPs与精神分裂症性别相关性分析显示,SNP2位点与女性精神分裂症发病密切相关,而SNP4与男性精神分裂症发病密切相关,表明精神分裂症在男女之间存在着遗传异质性。这些结果提示,UFD1L和CLDN5基因可能是精神分裂症相关基因。22q11-12区域可能存在多个决定精神分裂症易感性和抗性的突变位点。这些位点可能存在于同一个基因上,即等位基因异质性;也可能存在于不同基因上,即位点异质性。此项研究工作是后基因组时期功能基因组学研究的前沿课题。本实验结果将有助于阐明精神分裂症的分子遗传学机制,为在基因水平上建立诊断方法,开发新型药物奠定重要的实验基础。

宋焱翼[5]2004年在《基于小波分析的DNA分形特性研究》文中提出对于脱氧核糖核酸(DNA)序列分形特性的研究能够揭示DNA序列在整体尺度下的结构特征,使得可以更深入地认识DNA所包含的遗传信息。本文从生物学的研究成果出发,论述了生物系统的复杂性和非线性性,指出以系统和综合的观点来研究生物学的必要性。分形是研究非线性问题的理论,DNA序列的非线性性可以用其分形特性来刻画。本文在总结已有文献的基础上,提出了采用小波分析来研究DNA序列分形特性的方法。采用分数布朗运动(FBM)来对DNA序列的碱基分布进行参数化建模,用墨西哥帽小波变换来计算DNA序列的Hurst指数,通过Hurst指数来刻画DNA序列的自相似特性。 该方法引入参数化的分析方法,利用小波变换进行参数计算,与Fourier分析方法相比较,该方法在统计上更加稳定,结果也更加可靠。DNA序列由腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)和胸腺嘧啶(T)四种碱基组成,不能直接对其进行信号处理,应用DNA walk理论将DNA序列分别映射为数字信号AG walk、AC walk和AT walk,对每一条序列分别计算其Hurst指数,并将其视为表征DNA序列分形特性的一维特征。Hurst指数作为表征一类数据统计特性的一个重要指标,它刻画了时间序列自相似性及序列发展的相关强度。FBM是研究的较深入的自相似模型,可以利用FBM对DNA序列进行参数化建模。小波变换具有尺度无关的特性,是非常适合对分形结构进行量化分析的工具。利用小波变换对经过FBM建模后的DNA序列进行Hurst指数的提取的方法,分别以人类、抗菌素、原核生物、非脊椎动物和小鼠的DNA序列作为实验对象,对以上DNA序列经映射后得到的AG walk、AC walk和AT walk序列,计算其Hurst指数。计算结果表明,以上方法能够正确、方便地描述DNA序列的分形特性。该研究是进一步解释和阐明DNA序列中所存在的遗传信息和调控机理的基础。

胡颖[6]2004年在《人类染色体13q32区域精神分裂症相关基因的遗传学研究》文中指出人类基因组计划是人类认识自我的伟大科学工程,计划的目标是测定人类基因组的全部序列,从而通过解读全部遗传信息,阐明人类基因组及所有基因的结构和功能,揭开人类生命的奥秘。人类基因组是一个十分稳定却又存在各种变异的体系。不同种族、群体和个体都有46条染色体,有相同数目的基因和基因分布,也有基本相同的核苷酸序列。这种基因组结构的稳定性保证了人类作为一个物种的共同性和稳定性。在长期进化的过程中,基因组DNA序列又不断发生变异,其中一些变异被保存下来,导致了不同种族、群体和个体间基因组的差异和多态性。人类基因组计划的最伟大成就之一就是发现数以百万计的多态性遗传标记,众多的多态性遗传标记不仅有助于基因的鉴别和定位,在整个基因组水平上探讨基因与基因、基因与环境的相互作用机制,而且对于揭示与遗传因素密切相关的人类重大疾病(如肿瘤、心脑血管疾病、神经与精神性疾病)的遗传本质具有重要意义,为人类最终在基因水平上预防、诊断和治疗疾病奠定了重要基础。人类基因组中,最常见的DNA序列变异形式是单核苷酸多态性(SNP),约占90%左右。至今已发现超过15000个SNPs并保存到公共数据库。SNPs以其丰富、稳定和容易判定等特点逐步取代微卫星成为研究基因组多样性和识别、定位疾病相关基因的新一代遗传标记。它不但有助于解释个体的表型差异、不同群体和个体对疾病,特别是对复杂疾病易感性的差异,对各种药物反应性、耐受性的差异及对环境因子反应性的差异,而且通过建立序列变异与表型、序列变异与疾病风险之间的关系,将复杂疾病的预防、诊断和治疗置于坚实的遗传学基础上,从而使HGP给人类健康带来实际的利益。精神分裂症是一种以基本个性改变,思维、情感和行为的分裂,精神活动与环境不协调为主要特征的精神疾患,是人类面临的最为严重的疾病之一。在全世界范围内终生患病率接近1%(种族、地域、文化等差异不显着)。精神分裂症的严重之处在于:不仅给患者本人造成终身的痛苦,这种痛苦除来自疾病本身的折磨外,还来自于社会经济地位的下降、社会的歧视及治疗药物的副作用等;而且给家庭和社<WP=114>会造成长期沉重的负担,精神分裂症约占全球疾病总负担的2.8%,占用大量的医疗卫生资源。因此,确定精神分裂症的病因并在基因水平上预防和治疗疾病是当前医学研究中的重大课题。遗传流行病学研究证实,精神分裂症与遗传因素关系密切,但并非经典的孟德尔单基因遗传疾病,不是由一对显性或隐性基因所导致,而是多对微效基因所产生的协同作用,属于多基因遗传的人类复杂疾病。全基因组扫描连锁分析及连锁不平衡研究为筛检精神分裂症易感基因提供了强有力的研究手段,人类基因组计划已构建和正在构建的遗传图、物理图、基因图、DNA序列图、SNP图和单倍型图为定位精神分裂症易感基因提供了强有力的研究工具。目前,精神分裂症易感基因研究已经取得了较大进展,许多研究报道证实1q21-22、5q31-33、6p21-24,6q25-26、8p21-22、10p11-15、13q14-33及22q11-13等染色体区域可能含有精神分裂症易感基因。本研究工作选择人类第13号染色体长臂叁区二带(13q32)为精神分裂症易感基因候选区域,应用基于家系的连锁不平衡分析方法和基于群体的case-control相关分析方法在13q32染色体区域内筛检与精神分裂症相关联的基因位点。以229个中国汉族精神分裂症患者及其健康父母双亲组成的核心家系为研究对象,利用生物信息学工具,通过http://www.ncbi.nlm.nih.gov/、http://www.ncbi.nlm.nih.gov/SNP及http://snp.cshl.org/等数据库,确定13q32染色体区域内的48个已知基因,浏览每个基因上的SNPs。在每个基因DNA序列上分析1~2个含有限制性内切酶酶切位点,杂合度大于10%的SNPs。选定13q32染色体区域内3个候选基因和2个EST上的7个SNPs,包括结合糖基磷脂酰肌醇的硫酸乙酰肝素蛋白多糖6基因(GPC6)的rs2892679、丝氨酸/苏氨酸激酶24基因(STK24)的rs1886089和亲核素β3基因(KPNB3)的rs626716、rs624066和rs2761072及LOC160889(EST位点)的rs2282135和LOC122330(EST位点)的rs942358。长度横跨13139.81kb,在GPC6和LOC122330两个基因之间构建SNPs连锁不平衡图。用PCR-RFLP方法检测SNPs基因型,采用SPSS统计学软件管理和分析基因分型数据。用拟合优度卡方检验验证每个SNP基因型在抽样群体中的分布是否符合Hardy-Weinberg平衡。用EH plus和UNPHASED软件分析两个SNPs之间的连锁不平衡程度。对于单位点的SNP数据,除进行单倍型相对风险(HRR)和传递不平衡(TDT)方法分析外,还要进行临床亚组分析。这是因为由于SNPs的突变时间不同,每个SNP有其自己的遗传祖先,它们的等位基因频数分布可能互相干扰,只有进行临床亚组分析才能发现与疾病相关联的SNPs,排除假阴性结果,并证实临床异质性与遗传异质性的存在。对于两个以上SNPs构成的单倍型数据,用Transmit软件进<WP=115>行分析。针对精神分裂症的某一特定临床症状将患者分为有或无该症状两组,分析每个SNP位点等位基因及基因型在两组之间的分布是否有显着性差异,从而推测SNPs位点与精神分裂症临床症状的关系

谈承杰[7]2014年在《基于数学模型的基因数据结构分析》文中研究说明基因数据结构分析是生物信息学研究的重要内容,其研究对象主要为DNA序列和蛋白质序列.而对DNA序列的分析研究对于其空间结构、相应的RNA序列、mRNA序列以及蛋白质序列有着重要的意义.利用数学建模的思想,对基因数据结构的生物信息进行深入挖掘,有助于对蛋白质空间结构及功能的预测,并为分子进化与基于生物类结构的药物设计提供合理的指导依据,也为生产生活带来一定的经济效益.本文针对基因序列的单碱基,碱基对,叁联体密码子结构,采用理论分析与数据处理相结合的方法,系统的开展基因数据结构的数学建模研究,并充分地应用于热点基因中,具体工作如下:1、利用RSCU方法对影响密码子使用的各项参数进行统计分析,再根据QRSCU编码方法,对p53密码子偏好性间距进行了分析设计,得出了基于拟氨基酸编码的方法能充分体现p53密码子对同义密码子的一致偏好性的结论,且p53基因更偏好使用以c或g结尾的同义密码子,并对6条基因序列作了病变预测.2、密码子是生物特性的一个重要表达,通过使用CGR方法的基因签名来研究外来入侵物种不同组织序列的基因签名及遗传多样性聚类分析,得出基因序列在密码子的使用上是非均衡的,且物种亲缘关系近的,则基因签名相似度越高,基因签名还揭示了密码子的第叁位碱基偏好使用碱基T的现象,因而分析了序列聚类谱系图.3、根据序列平均功率谱、序列数字化指标特性,且以海明距离作为相似性分析的约束因子,提出了一种基于结构聚类的多指标相似性研究方法,对所选取的7条肿瘤蛋白p53mRNA的完整cds进行了聚类结构分析和确定了最优聚类数.4、综合单碱基、碱基对、叁联体碱基的数字化研究方法,提出了一种新的DNA序列的4D图形表示方法,该方法能较全面地体现DNA序列中的生物信息特征,且有效的避免了信息的丢失.并利用DNA序列4D图形的几何中心点作为序列分析的特征数值,构造了向量终点间的欧氏距离和夹角,并结合构造的欧氏距离构建了物种的系统聚类分析图.本文的创新点如下:1、利用了拟氨基酸编码(QRSCU)的方法,从而能充分体现p53密码子对同义密码子的一致偏好性的结论;2、给出了基于结构聚类的多指标相似性研究方法,从而避免了相似性分析指标的单一而造成的误差,且具有一致聚类的特点,聚类结果符合生物分类学;3、结合数字化碱基的方法,引入几何中心作为序列特征数值,构建了一个新的4D图形表示的数学模型,较全面地体现了DNA序列中的生物信息特征,且有效的避免了信息的丢失,并构建聚类谱系图,其聚类结果总体符合生物分类学.

孙维斌[8]2003年在《秦川牛肉用性状及八个黄牛品种遗传关系的DNA分子标记研究》文中研究说明本研究采用了PCR—RFLP、ASM—PCR、DNA序列分析和微卫星DNA标记技术研究了秦川牛的生长激素基因、胰岛素样生长因子-1基因、胰岛素样生长因子结合蛋白3基因的多态基因座及14个微卫星位点与秦川牛产肉性状(体尺、体重及屠宰性状)的相关性,并用13个微卫星标记分析了秦川牛、中国荷斯坦牛、郏县红牛、南阳牛、鲁西牛、渤海黑牛、延边牛和晋南牛8个黄牛品种共计314个个体的遗传多态性,探讨了8个黄牛品种间的遗传关系,为秦川牛产肉性能的高效选育和各黄牛品种分子标记数据库的建立、种质资源的保存及利用提供分子遗传学依据。本论文通过上述研究取得了以下结果: 1 秦川牛生长激素基因127位和172位氨基酸基因座多态性与早期生长发育关系的分析 1.1 秦川牛生长激素基因127位氨基酸基因座和172位氨基酸基因座的ASM-PCR分析结果表明,在秦川牛群体中,生长激素127位基因座表现为2种类型,其中AA型、AC型的频率分别为0.53 0.47和0,该基因座处于Hardy-Weinberg不平衡状态(P<0.05)。生长激素172位基因座表现为3种类型,其中BB型、BC型、CC型的频率分别为0.642、0.269和0.090,这个基因座处于Hardy-Weinberg不平衡状态(P<0.01)。 1.2 秦川牛生长激素基因127位氨基酸多态基因座基因型与秦川牛初生性状的相关性分析表明,该基因座AA型秦川牛个体的初生重、坐骨端宽及体长指数显着高于AC型个体(P<0.05);此外,AA型秦川牛个体的断奶重比AC型个体高13.26kg,但差异并不显着(P>0.05)。 1.3 秦川牛生长激素基因172位氨基酸多态基因座变异与初生性状的相关性分析表明,秦川牛生长激素172位氨基酸基因座的BB基因型个体初生重显着高于BC型、CC型(P<0.05)。CC基因型个体体斜长和肉用指数(BPI)显着高于BB型、BC型个体及群体均值(P<0.05),而CC型个体的断奶重显着高于BB型、BC型个体及群体均值(P<0.01),比BB型和BC型分别高出21.32kg、24.42kg。论文摘要2秦川牛生长激素外元V和3’侧翼区多态性与秦川牛屠宰性状的相关性 分析2.1秦川牛生长激素外元V和3’侧翼区多态基因座PCR一RFLP分析结果表明,该多态基因座表现出3种基因型。其中EE、EF和FF基因型的频率分别为0.32、0.56和0.12.等位基因E、F的频率分别为0.60和0.40,该基因座处于Hardy一Weinberg平衡状态(几0.05)。2.2秦川牛生长激素外元V与3’侧翼区多态性与秦川牛胭体性状相关性分析结果表明,该多态基因座的基因型对于宰前重、胭体重、净肉重、屠宰率、净肉率、胭体产肉率无显着影响(P>0.05),但EE型、EF型的骨重显着高于FF型(尸<0.05),EE型的眼肌面积显着高于EF型和FF型(P<0.05)。2.3生长激素外元V与3’侧翼区多态基因座与秦川牛胭体切块产量的相关性分析表明,EE型秦川牛个体的牛柳、霖肉、臀肉占朋体的比例显着高于EE型和FF型 (P<0.05)。3秦川牛的IGF日弃3基因多态性与秦川牛屠宰性状的相关性研究3.1秦川牛的IGFBP一3多态基因座的PCR一即LP分析表明,在秦川牛群体中,IGFBP一3基因座位有3种基因型,其中AA型、AB型、BB型的频率分别为0.70、0.28和0.02,等位基因A、B的频率分别为0.84和0.16,该位点处于Hardy一weinberg平衡状态(办0.05)。12秦川牛的IGFBP*3多态基因座基因型与秦力l牛胭体性状的相关性分析表明,AA型、AB型个体的宰前重、月同体重及骨重略有差异,但差异不显着(P>0.05),AA型、AB型个体的屠宰率、净肉率有依次降低的趋势(几0.05),AA型个体的眼肌面积显着高于AB型个体(尸<0.05)。3.3秦川牛IGFBP一3基因多态基因座与秦川牛肉质性状的相关性分析表明,IGFBP一3多态基因座的基因型对秦川牛肉质性状指标有一定影响。AA基因型个体的牛肉水分含量显着高于AB型个体(尸<0.01),AB基因型个体的牛肉脂肪含量显着高于AA型个体(P<0.01),但是AA型个体和AB型个体牛肉的粗蛋白、粗灰分含量差异不显着(P>0.OS)。AA基因型个体的牛肉剪切力大于AB型个体(尸<0 .05),这表明AB型秦川牛牛肉的嫩度优于AA型个体。AA型个体和AB型个体的胭体脂肪的脂肪酸组成差异较大,AB型个体胭体脂肪中豆范酸、亚麻酸含量显着高于AA型个体 (P<0.ol),AB型个体胭体脂肪中豆范烯酸、油酸高于AA型个体(尸<0 .05)。3.4 IGFBP一3基因多态基因座基因型与秦川牛部分牛肉切块产量的相关性分析表明,AA型个体的牛柳占胭体的比例显着高于AB型个体(尸<0.05),但该基因座对秦川牛其他腑体切块的产量无显着影响(P>0.05)。3.5 IGFBP一3基因多态基因座对秦川牛牛肉的氨基酸构成有一定的影响,AA型个体牛肉中的天冬氨酸的含量显着高于BB型个体(P<0.05)。西北农林科技大学博士学位论文3.6秦川牛IGFBp一3基因65 lbp的pCR产物序列与GenBank中所报道的牛IGFBp一3基因序列(Aeeession No.U83465)相应部分同源性达到99.39%,秦川牛IGFBP一3基因299位发生了1次颠换(C一A),是产生Haeln酶切多态性的根本原因。4秦川牛胰岛素样生长因子一1基因启动子区SnaBI酶切位点的分析 所分析的42个个体该基因座均表现一致性的带谱,没有多态性。5秦川牛微卫星位点多态性与体尺及产肉性状关系的研?

马超[9]2014年在《单核苷酸多态性与广州汉族人群前列腺癌的相关性研究》文中研究表明研究背景:前列腺癌是影响男性健康的最常见恶性肿瘤之一,多发生于60岁以上的老年男性,2002年全球新发病例为679000例,居于男性肿瘤的第二位。前列腺癌的发病率因地域及种族的差异而不同。前列腺癌发病率最高的地区是北美和斯堪的纳维亚半岛,而大部分亚洲国家为低发病率地区。美国黑人前列腺癌的发病率最高,达到185.7/10万,美国高加索人(白种人)107.8/10万,其它西方发达国家的发病率为50~103/10万。在欧洲国家,每年大约有190000新发病例,并且大约有80000例患者死于前列腺癌。亚洲国家中,中国和日本发病率低于其他国家,日本发病率为9/10万,中国发病率为2.3/10万(上海地区为7.7/10万)。无论是前列腺癌的高发地区还是低发地区,从1973年到1992年前列腺癌的发病人数都在逐年增加。因此研究前列腺癌发生发展的相关因素以及早期预防前列腺癌的发生是当务之急。目前对前列腺癌的病因尚不完全清楚,年龄、种族、家族史是目前已知的危险因素。不同种族和地区间发病率的差异可能与遗传背景、环境及生活方式等多方面因素有关。有研究已证实遗传易感和环境因素都会对前列腺癌的发生造成影响,其中遗传易感的重要物质基础之一就是单核苷酸点突变所造成的单核苷酸多态性。单核苷酸多态性(Single Nucleotide Polymorphisms, SNPs)是在基因组水平由单个核苷酸的变异所引起的DNA序列多态性。其中发生率小于1%的变异称为突变,大于1%的则称为单核苷酸多态性。SNPs在人类基因组中广泛存在,是人类可遗传的变异中最常见的一种,占所有已知多态性的90%以上。人类基因组中大概每1000个碱基就有一个SNP, SNPs总量大约为3×106个。由于SNPs仅涉及单个碱基的变异,故可以由单个碱基的转换(transition)或颠换(transversion)所引起,也可由碱基的插入或缺失造成。通常所说的SNPs是指转换和颠换。大部分SNPs是无意义的,不影响蛋白功能或者基因表达(如非编码区SNPs)。一般根据SNPs在基因组中的位置以及是否引起基因编码的改变,可将SNPs分为几类:约95%的SNPs位于非编码区,其中一小部分位于基因调控区,称为基因调控区SNPs (regulatory SNPs, rSNPs);而位于基因编码区的SNPs称为编码SNPs (coding SNPs, cSNPs)。若cSNPs不改变所编码的氨基酸序列则称为同义SNPs (synonymous SNPs, sSNPs),导致氨基酸序列改变则称为非同义SNPs或错义SNPs (non-synonymous SNPs, nsSNPs)。SNPs能通过多种途径影响基因的功能,有一部分已被证明SNPs和前列腺癌发生、发展及预后密切相关。由于SNPs在人群中分布广泛,并且这种遗传标记相对稳定,能从个体出生到死亡一直存在,使遗传分析能在发病前几十年进行开展。因此,SNPs不但能提供和证明肿瘤发生的遗传性病因,也为常见肿瘤普查提供了一种有效的检测手段。SNPs作为第叁代遗传标记,只有两种等位型,变异程度不如微卫星,但由于在基因组中总数量巨大,分布频密,具有较微卫星更稳定的遗传特性。在基因组筛查SNPs过程中一般只需阳性或阴性(+/-)分析,故易于分型检测并实现分析的自动化。相比第一、二代遗传标记更有适合对复杂疾病遗传的解析和基于群体基因识别等方面的研究,并已取代微卫星标记技术进入基因研究应用的领域。采用SNPs进行分析有助于解释不同个体之间的表型差异、不同群体和个体对疾病,特别是对复杂疾病易感性、药物耐受性以及对环境因素的反应差异,目前已广泛应用于分子诊断、临床检验、法医学、病原检测、遗传疾病和新药研发等方面。常见的SNPs的分析方法分为叁类,第一类为基于遗传流行病学的关联分析,是通过研究SNPs在疾病易感性、药物反应性及其他相关遗传表型差异的方法;第二类为细胞和生化水平的分析,通过分析酶活力、细胞信号通路等方面来阐述SNPs对基因功能方面的影响;第叁类为基于SNPs影响基因表达的分子机制研究,通过对SNPs在基因转录、翻译及蛋白表达的作用进行分析,探讨SNPs影响基因功能的机制。2008年Zheng SL等在新英格兰医学杂志上发表的文章中提到,在五个前列腺癌高风险位点中(叁个位于8q24,另两个分别位于17q12和17q24.3)各选择一个危险比最高的SNP进行联合分析,这五个SNPs各自的前列腺癌患病风险比值比(OR)在1.22到1.53之间,然而当基因型同时具有四至五个SNPs时OR值将达到4.47;若将前列腺癌家族史也当做一项危险因素时(单独OR值为2.22),则具备六项危险因素中的五项甚至全部时,其OR值高达9.46(P=1.29×10-8)。该研究结果表明,多个SNPs联合分析有助于提高人群前列腺癌患病风险的预测效力。日本冈山大学研究小组通过筛选癌症相关基因中的48个错义SNPs(非同义SNPs),发现其10个基因中共计12个SNPs对前列腺癌发病有重要影响。这10个基因包括5个肿瘤抑制基因、2个DNA修复基因、1个代谢酶基因、1个染色体分离相关基因和1个凋亡调节基因,其中9个SNPs与肿瘤的相关性是首次被发现。这12个SNPs在预测前列腺癌患病风险方面同样具有累积效应,它们确定的最高风险组与低风险组人群相比其OR值高达47.4。最高风险组在今后30年间前列腺癌患病的风险是29%,而低风险组为0.6%,其中最低风险组仅约0.2%。因此,通过整合多个肿瘤相关SNPs进行肿瘤患病风险遗传学评估,进一步提高前列腺癌高风险人群的筛查准确性和效率,并有利于肿瘤的预防和早期诊断。由于地理位置和人种起源相近,中国人群与日本人群在遗传背景上具有很大的相似性。在日本人群大规模筛选获得的前列腺癌风险SNPs也有可能部分适用于中国人群,为了验证这一假设,并进一步将在日本人群中获得的研究成果拓展到中国及亚洲其它国家,中国、日本、韩国和新加坡四国共同发起了一项国际多中心研究,旨在检验上述前列腺癌风险SNPs在亚洲其他人群中的效力。本文中所选位点是来源于日本冈山大学研究小组的成果、同该多中心研究内容一致。目的和意义:1、分析前列腺癌组和对照组人群中多个特定单核苷酸多态性位点的分布情况,探讨多个特定位点与广州汉族人群前列腺癌患病风险的相关性,寻找阳性位点以用于指导前列腺癌的预防和早期诊断。2、尝试建立多个阳性单核苷酸多态性位点联合分析广州汉族人群前列腺癌患病风险的预测模型。方法:自2012年6月至2013年7月,在南方医科大学珠江医院、广东省人民医院招募112例前列腺癌(Pea)患者和104例非前列腺癌及其他恶性肿瘤患者(对照组)。两家医院均位于广州,受试者均为汉族男性。病例组为经穿刺活检或术后病理确诊的前列腺癌患者,初次发病或复诊均可。对照组为非前列腺癌及其他恶性肿瘤患者,在年龄上与病例组患者保持匹配,也是在相同时期相同的医疗单位住院或门诊就诊的患者。记录患者的临床资料如发病时年龄、PSA、Gleason评分、TNM分期、治疗方式及治疗效果等,并向患者发放调查问卷,调查内容包括吸烟史、饮酒史、家族史、饮食习惯等。经患者签署知情同意书后,抽取的2m1外周静脉血采用EDTA抗凝管在-20℃(或-80℃)条件下保存。采用TIANamp Blood DNA Kit血液基因组DNA提取试剂盒进行全血基因组DNA提取。利用多重SNaPshot SNP分型技术对收集到的DNA进行基因分型,所观察的8个位点以所在基因命名分别为SMARCAD1SNP、RAD17SNP、 AXIN2SNP、CASP9SNP、PSMD8BP1SNP、DCLREIB SNP、MMP27SNP、BARD1SNP。统计学处理:采用Pearson's X2检验的方法对对照组每个SNP位点基因型分布情况进行Hardy-Weinberg平衡检验并通过R语言实现。计算各临床指标在病例组和对照组之间的差异或者不同基因型之间的差异时采用Pearson's X2检验。采用logistic回归分析计算特定基因型与所研究人群前列腺癌发病风险的比值比(ORs)、95%可信区间(Confidence intervals, CIs)及相应的P值,以分析前列腺癌和基因型的相关性。将年龄和肿瘤危险度对与前列腺癌患病风险相关的SNPs进行分层分析。其中,年龄方面前列腺癌组采用初次发病的年龄、对照组采用招募入组时的年龄,最终分为>72岁组和≤72岁组。在肿瘤危险度方面,分为局限型前列腺癌和进展型前列腺癌。局限型前列腺癌组须同时满足以下标准:TNM分期T1-2; NO/NX; MO/MX; Gleason评分2-7分;PSA≤50ng/ml。进展型前列腺癌组须满足如下条件之一:TNM分期T3/4; N+; M+; Gleason评分8-10分;PSA>50ng/ml。将年龄、吸烟及饮酒状况作为前列腺癌患病风险多因素回归模型的混杂因素。所用统计学软件为SPSS20.0,所有统计检验为双侧检验,计算结果P值<0.05时认为差异有统计学意义。结果:1、选定的8个SNPs基因型(或等位基因)分布与前列腺癌发病风险的相关性分析:无论对年龄、吸烟、饮酒等混杂因素校正与否,SMARCAD1SNP. CASP9SNP、PSMD8BP1SNP、DCLRE1B SNP、MMP27SNP、BARD1SNP计算结果P值均大于0.05,提示病例组和对照组基因型(或等位基因)之间的差异无统计学意义。而经初步相关性分析,提示RAD17SNP和AXIN2SNP[rs2240308]与前列腺癌存在相关性。因RAD17SNP在对照组中基因型的分布经Hardy-Weinberg平衡检验结果为P=0.0324,故认为其人群代表性有一定局限性,本文不做进一步计算,只对AXIN2SNP[rs2240308]进一步统计分析。AXIN2SNP[rs2240308]GG基因型在病例组(59.2%)中的频率明显高于对照组(39.0%),GA基因型在病例组中的频率(30.1%)低于对照组(52.0%)。G等位基因在病例组中的频率(74.3%)高于对照组(65.0%),相反,A等位基因在中对照组的频率(35.0%)高于病例组(25.7%)。GA基因型携带者与GG基因型(作为参考)携带者相比,其校正OR值为0.377(95%CI:0.206-0.688,P=0.001),有统计学意义。AA基因型携带者与GG基因型携带者相比,其校正OR值为0.830(95%CI:0.309-2.232,P=0.712),无明显统计学意义。G等位基因(作为参考)与A等位基因在病例组和对照组之间的差异仍具有统计学意义(P=0.048),其校正OR值为0.649,95%CI:0.422-0.996。2、对阳性位点AXIN2SNP[rs2240308]按年龄分层进行分析:GA基因型携带者在≤72岁组(校正OR=0.419,95%CI:0.181-0.969,P=0.042)和>72岁组(校正OR=0.364,95%CI:0.150-0.879,P=0.025)均提示前列腺癌的患病风险相比GG基因型(作为参考)携带者下降。A等位基因携带者在≤72岁组提示患病风险下降(校正OR=0.514;95%CI:0.281-0.940;P=0.031),但在>72岁组未发现有统计学意义(校正后P=0.646)。3、对阳性位点AXIN2SNP[rs2240308]按肿瘤危险度分层进行分析:GA基因型携带者在局限型组(校正OR=0.246,95%CI:0.100-0.607,P=0.002)和进展型组(校正OR=0.446,95%CI:0.228-0.873,P=0.018)均提示前列腺癌的患病风险相比GG基因型(作为参考)携带者下降。A等位基因携带者在局限型组提示患病风险下降(校正OR=0.408;95%CI:0.206-0.807:P=0.010),但在进展型组未发现有统计学意义(校正后P=0.271)。从另一方面看,通过分层分析,我们可以发现A等位基因在≤72岁组和局限型组中患病风险下降。4、AXIN2SNP[rs2240308]基因型和临床指标之间的关系:各临床指标在GG基因型组和non-GG基因型组之间差异均无统计学意义。结论:通过病例对照研究发现,Axin2SNP [rs2240308]与广州汉族人群前列腺癌可能具有相关性。Axin2SNP [rs2240308:G/A]中的GA基因型对广州汉族人群前列腺癌患病风险中可能呈现保护性作用。据我们所知,本研究为首次发现Axin2SNP [rs2240308:G/A]和前列腺癌患病风险可能具有相关性。Axin2SNP[rs2240308]可能会成为前列腺癌的早期诊断和易感性评估的生物学标志物。

郭慧慧[10]2012年在《栉孔扇贝TGF-β/Smad信号通路基因的克隆、表达分析及生长性状相关SNP位点筛查》文中指出转化生长因子β (transforming growth factor β, TGF-β)超家族是一组具有结构相关性的多功能细胞因子,在细胞增殖、分化和生长等生物学过程中具有重要作用。TGF-β超家族成员首先与细胞膜表面的II型和I型受体结合,启动其信号传导,进而激活下游Smad蛋白,将信号传递至细胞核内,调节靶基因的转录。本文采用同源克隆、电子克隆等技术,对栉孔扇贝中TGF-β/Smad信号通路中11个基因进行了cDNA和DNA克隆,并运用生物信息学方法分析了各基因核苷酸和氨基酸序列特征;利用实时荧光定量反转录PCR (Real-time qRT-PCR)技术对11个基因进行了表达分析;通过重测序和EST数据库分析,筛查基因中的SNP位点,用高分辨率熔解曲线技术(High resolution melting, HRM)对所得SNPs在全同胞家系及野生群体中进行了基因分型,并开展了SNP与栉孔扇贝生长性状和基因表达的相关性分析,为扇贝TGF-β/Smad信号传导和相关基因功能的研究,及生长性状相关标记的开发和应用提供了参考。主要结果如下:1.获得了栉孔扇贝TGF-β超家族配体Myostatin (MSTN)和Bone morphogeneticprotein2(BMP2)及抑制因子Follistatin的cDNA全长及DNA序列,确定了其基因组结构。MSTN和BMP2均由3个外显子和2个内含子组成,编码的氨基酸序列具有信号肽、前肽区、蛋白酶水解位点(RXXR)、C端成熟区等TGF-β超家族的典型结构域。对MSTN5’侧翼序列进行分析,发现了COMP、MEF2、MTBF和E-box等多个肌肉特异性调控元件。Follistatin由5个外显子和4个内含子组成,5个外显子分别编码信号肽、N端结构域和3个FS结构域。Real-time qRT-PCR结果显示,MSTN和BMP2除在原肠胚期有较高水平表达外,在其它胚胎/幼虫时期相对表达量均较低,Follistatin则在受精卵和4细胞期表达量较高;3个基因在所测各成体组织均广泛表达,其中MSTN在横纹肌中相对表达量最高,BMP2和Follistatin在鳃中表达量最高。HRM分析结果显示,MSTN中获得5个、Follistatin中获得1个具有多态性的SNP。位于MSTN5’侧翼序列的SNP位点g.-1163G>T与一个全同胞家系扇贝壳长、壳高、横纹肌重等生长性状显着相关,其中TT型个体壳长、壳高、横纹肌重显着高于GT型个体(P<0.05)。野生群体中高横纹肌量组TT基因型频率显着高于低横纹肌量组(P<0.05)。Real-time qRT-PCR结果显示,上述全同胞家系中GT基因型个体横纹肌中MSTN表达量显着高于GG型和TT型个体(P<0.05)。栉孔扇贝MSTN基因高表达量基因型与低横纹肌量基因型相同,提示了该基因可能对扇贝横纹肌的生长起负调控作用,与哺乳动物中MSTN在骨骼肌生长发育过程中的功能相符。2.获得了丝氨酸/苏氨酸激酶受体基因Activin type II receptor (ActR2)、Activin-like receptor1(ALR1)、TGF-β type I receptor (TGFBR1)和BMP type I receptor(BMPR1)的cDNA全长序列,4个基因编码的氨基酸均具有膜外区、跨膜区、激酶区等TGF-β超家族丝氨酸/苏氨酸激酶受体的特征性结构。通过基因组数据库比对确定了ActR2和TGFBR1的基因组结构,分别由6个和10个外显子组成。检测栉孔扇贝胚胎/幼虫不同发育时期及成体组织中各基因表达水平,结果显示,4个受体基因均在受精卵、4细胞期和囊胚期有较高表达量,幼虫期表达量较低;各基因在所测组织中均有表达,且性腺和横纹肌中表达量较高。此外,在TGFBR1基因3’非编码区(untranslated region, UTR)筛得的SNP c.1815C>T与一个全同胞家系扇贝壳长、壳高、横纹肌重等生长性状显着相关,TT型个体的上述叁个性状显着高于CC型个体(P<0.05)。Real-time qRT-PCR结果表明,该全同胞家系中CC型个体横纹肌中TGFBR1表达量显着高于TT型个体(P <0.05)。CC型扇贝个体横纹肌重最低而横纹肌中TGFBR1表达量最高,表明TGFBR1可能参与扇贝横纹肌生长的负调控,与哺乳动物中TGFBR1转导的TGF-β信号在肌肉生长中的负调控作用相符。3.克隆得到了Smad家族Smad1、Smad3、Smad4和Smad6基因的cDNA全长序列,并确定了其基因组结构,分别包含7个、9个、5个和5个外显子。Smad1、Smad3和Smad6编码的氨基酸序列均由Smad蛋白家族典型的MH1和MH2两个结构域组成;但Smad4只含MH1结构域,MH2缺失。表达分析结果显示,栉孔扇贝胚胎/幼虫不同发育时期中,Smad1、Smad3、Smad4和Smad6均在原肠胚期有较高水平的表达,其它时期表达量较低;各基因在成体组织中广泛表达,Smad1、Smad3在横纹肌中表达量最高,Smad4在性腺中表达量最高,Smad6则在鳃中表达量最高。通过数据库比对在Smad3基因编码区筛得一个同义突变位点c.846G>T,该位点与一个野生群体扇贝壳长、壳高、总重、软体重和横纹肌重等性状显着相关,GG型个体上述五个性状显着高于GT型个体(P<0.05)。Real-time qRT-PCR结果显示,该野生群体中GT型个体横纹肌中Smad3表达量高于GG型个体。Smad3表达量最高的GT型扇贝个体横纹肌量最低,暗示了该基因可能抑制扇贝横纹肌的生长,与哺乳动物中Smad3转导的TGF-β信号参与细胞生长负调控的作用相符。

参考文献:

[1]. DNA序列相关性结构研究综述及人类基因组序列相关性分析[D]. 刘劲松. 北京工业大学. 2001

[2]. 精神分裂症相关SNPs位点的病例—对照与家系合并样本的关联性研究[D]. 李鹤遥. 吉林大学. 2010

[3]. 精神分裂症易感基因的遗传学研究[D]. 张海英. 吉林大学. 2007

[4]. 人类染色体22q11-12区域精神分裂症相关基因的遗传学研究[D]. 叶琳. 吉林大学. 2006

[5]. 基于小波分析的DNA分形特性研究[D]. 宋焱翼. 重庆大学. 2004

[6]. 人类染色体13q32区域精神分裂症相关基因的遗传学研究[D]. 胡颖. 吉林大学. 2004

[7]. 基于数学模型的基因数据结构分析[D]. 谈承杰. 江南大学. 2014

[8]. 秦川牛肉用性状及八个黄牛品种遗传关系的DNA分子标记研究[D]. 孙维斌. 西北农林科技大学. 2003

[9]. 单核苷酸多态性与广州汉族人群前列腺癌的相关性研究[D]. 马超. 南方医科大学. 2014

[10]. 栉孔扇贝TGF-β/Smad信号通路基因的克隆、表达分析及生长性状相关SNP位点筛查[D]. 郭慧慧. 中国海洋大学. 2012

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

DNA序列相关性结构研究综述及人类基因组序列相关性分析
下载Doc文档

猜你喜欢