基于16S论文_余敏红

摘要:微生物研究从人工分离培养开始,但是,大部分微生物无法在实验室条件下生存,这对微生物多样性研究产生直接的影响。基于此,在高通量DNA测序技术的应用下,以16S rRNA和宏基因组高通量测序为基础,对微生物多样性展开研究,并以水体微生物、人体舌苔微生物(变量为是否有胃病)对比为研究对象,旨在实现16S rRNA和宏基因组高通量测序在微生物多样性研究中的应用效果提升。

关键词:16S rRNA;宏基因组;微生物;多样性

引言:从不同的角度出发,选择多种指数对微生物多样性进行度量分析,可以以系统发生树或者基本可操作分类单元为主,在实际操作过程中,则需要利用树形结构标识不同微生物之间的进化距离。基于此,以16S rRNA和宏基因组高通量测序为基础,以水体微生物、人体舌苔微生物(变量为是否有胃病)为样本,并对微生物多样性展开讨论,结合微生物序列数、不同分类水平的分类单元以及测序深度,实现微生物多样性特征及规律的检验与分析[1]。

116S rRNA基因与宏基因组高通量测序数据分析

在对16S rRNA与宏基因组测序进行分析时,以数据预处理、可操作分类单元划分、物种分类以及丰度信息注释的方式进行处理。一方面,16S rRNA的测序过程是化学反应过程,在试剂或者实验环境等因素的变化, 以DNA测序为基础,在对测序的质量控制进行分析时,提出含有未识别的碱基,根据序列的最低、平均或者类似准则来提出低质量序列。在此基础上,还需要进行双端序列拼接,由于不同物种高变区长度不同,所以需要确定重叠区域的位置,在实际研究的过程中,利用PANDAscp来完成双段序列连接。在预处理的过程中,以混合样本分离为最终目标,而且,以OYU为基础,通过序列比对相似度阈值的16S rRNA基因序列聚类分析,获得序列集合[2]。在利用统计模型的基础上,从序列参数以及物种类分类的角度进行控制,假设有k个OTU时,N为测序数据,则其概率公式如下:

在上述公式中,为k个高斯分布的混合比例,、为高斯分布的均值以及方差参数。此外,物种分类信息以树状结构为基础,其中包含界、门、纲、目、科、属、种等层次,在OTU划分下,则需要进行物种分类信息的注释。另一方面,在对宏基因组测序数据处理流程进行分析时,其数据预处理以测序质量控制以及“污染”序列剔除为中心。测序质量控制方面需要在16S rRNA的基础上,对序列末端质量低的碱基进行裁剪。在测序的过程中也是采用双端测序策略进行控制。利用物种进化树方面,则以“子树”比较及分析为基础,并通过分类水平控制,实现数据统计、微生物序列分析效果的进一步提升[3]。

216S rRNA和宏基因组高通量测序的对比分析

2.116S rRNA基因测序水体微生物

利用16S rRNA基因测序的方式对水体微生物进行研究,由于测序错误等级的影响,则需要对Alpha多样性进行分析,在对OTU划分进行过滤的基础上,选择多样本的方式进行分析,按照采样时间以及地点分组的方式,建立稀疏曲线,具体曲线变化如下:

图1 Alpha多样性指数稀疏曲线

结合上述对比结果,(a)、(b)的样本是以地点分组为主,(c)、(d)是按照时间分组的方式进行分析。在对变化曲线进行分析的过程中,古细菌群落的Alpha多样性在时间方面有明显的变化,4-6月份呈现上升趋势,8-9月份呈现下降趋势,在9月之后,水华现象得到了有效的环境,微生物群落得到了恢复。在此基础上,还需要对beta的多样性进行分析,在进行分析的过程中,以古细菌、细菌数据的PCoA、UPGMA为主。

同一采样时间的样本在PCoA途中有更近的距离,在利用adonis方法进行计算的过程中,可以通过Permutation的方法检验显著性,在n为9999的条件下,古细菌群落的总差异为22%,细菌群落则为27%,这说明不同地点,两种细菌的差异比较显著,与Alpha多样性的结果保持一致。

2.2基于宏基因组测序的人体舌苔微生物

在对人体舌苔微生物进行检验及分析的过程中,以Metatongue样本与HMP样本进行比较分析的方式进行检验。基于此,在进行研究的过程中,将HMP各种身体位点共690个样本与167个舌苔样本混合,并以genus分类的方式,选择“是否有胃炎”这一变量进行分析,在对BMI值变化以及关系等方面进行检验的基础上,从原点到物种点位置的方向与变量方向夹角逐渐减小,说明两者之间的相关性越大。基于此,对样本特征进行检验时,根据相似度矩阵,实现微生物样本特征分析。

在舌苔样本比较的过程中,龈下、龈上菌斑、颊粘膜的样本差异并不明显,所以,从phylum到species的不同分类水平的角度进行比较分析,可以发现两组样本有显著差别。

由于Metaphlan的方法只是对已知基因组数据的物种进行分析,在此前提下,利用样本物种数、Simpson指数进行检验及分析,在差异评估下,以胃炎病人样本与健康人样本为对比,以此实现舌苔微生物群落变化的影响分析。在进行检验及分析的过程中,以Bonferroni多检验校正为手段,并通过物种分析以及样本数据分析的方式,实现微生物与宿主之间的关系检验与分析。结合上述结果可以发现,胃炎病人样本与健康人样本都是均匀的混合在一起,没有明显的分组痕迹,但是,在对species的显著性进行分析的过程中,性别对于舌苔微生物群落影响较小,胃炎和年龄两个因素产生的影响相对较大。这也说明BMI较低的人极容易得胃炎,此外,也证明了微生物与胃炎之间存在密切关系。

2.3典型对应分析

在对16S rRNA和宏基因组进行分析的过程中,需要考察物种与各个变量的关系。在基因序列对比分析的过程中,测序数据来源与16S rRNA基因序列不同,因此多样性分析存在明显差异。在Metaphlan方法的应用下,可以对物种检测结果进行分析,在胃炎标识物的后补species中,可以通过舌苔微生物诊断胃炎,在利用CCA分析可以对样本之间、物质之间的相似度、环境变化关系等方面进行分析,以此实现宏基因组对微生物多样性的真实检验效果提升。

结语:基于16S rRNA和宏基因组高通量测序的微生物多样性研究,以预处理、OTU划分、分类信息注释为基本流程,并以聚类分析的方式,利用基因数据库,实现微生物数据分析、多样性变化程度等方面的综合分析。在对水体微生物群落多样性变化程度进行分析的基础上,发现微生物群落结构与卫生之间存在相互关系,而且需要从显著差异的角度进行统计分析,以此实现水体微生物的检验分析。

参考文献

[1]许亚昆, 马越, 胡小茜. 基于三代测序技术的微生物组学研究进展[J]. 生物多样性, 2019, 27(5).

[2]刘永鑫, 秦媛, 郭晓璇. 微生物组数据分析方法与应用[J]. 遗传, 2019, 41(9).

论文作者:余敏红

论文发表刊物:《医师在线》2019年21期

论文发表时间:2020/3/24

标签:;  ;  ;  ;  ;  ;  ;  ;  

基于16S论文_余敏红
下载Doc文档

猜你喜欢