金祖坚
浙江大学医学院附属第四医院 浙江义乌市 322000
摘要:lncRNA是一类内源性、转录本长度一般大于200nt、缺少特异完整的开放阅读框、无蛋白质编码功能的RNA分子。其作为增殖与分化调控通路上的调控分子,在基因的转录、翻译等过程中起重要作用,lncRNA也从转录、转录后和表观遗传学水平在关键性肿瘤信号通路中扮演重要角色,随着高通量筛查技术以及生物信息学的发展,更多具有重要调控功能的lncRNA将会被发现。
关键词:LncRNA,RNA
一、lncRNA的起源和功能
20世纪物理学界最重要的发现之一,可能就是“暗物质”,这种难以观察的物质以极大的权重裹挟着熟知的“明物质”的世界,动摇着关于物质世界的基本认知与规律。21世纪初,生命科学领域中最伟大的发现毫无疑问是另一种形式的“暗物质”:非编码RNA[1]。全基因组中仅仅不到2%的基因被转录成编码蛋白的成熟RNA,大多数DNA被转录成非编码RNA。非编码RNA依据长度可以分为两大类:短片段非编码RNA(包括siRNA、miRNA、piRNA)和长片段非编码RNA(lncRNA)。
1.1 lncRNA的定义和生物学特性
lncRNA是一类内源性、转录本长度一般大于200nt、缺少特异完整的开放阅读框、无蛋白质编码功能的RNA分子。它的结构虽然与mRNA分子类似,但它们缺乏长的进化保守的开放阅读框,其主要在RNA二级结构、基因结构修补序列或启动子区域上有进化保守性。它的表达具有时空特异性,其在不同组织的表达不同,一些lncRNA只在特定发育阶段表达或在不同发育阶段有不同的表达。
1.2 lncRNA的起源
LncRNA广泛存在于各个物种中,追溯lncRNA的起源,可能的过程有以下5种:
图1 lncRNA的可能起源过程[2]
A、一个蛋白编码基因(左方)的框架结构断裂从而转化成一个功能性非编码RNA(右方),这一非编码RNA与一些先前的编码序列合并。Xist这一lncRNA就由先前蛋白编码基因在与转座元件序列合并过程中经变形而形成。
B、在染色体重排以后,两个非转录并且先前距离较远的序列区域并列在一起引发一个多外显子非编码RNA的形成。
C、一个非编码基因通过逆转座作用复制形成功能性非编码逆基因或者非功能性非编码逆转录假基因。
D、非编码RNA内相邻的重复序列来源于两次串联复制事件。
E、转座元件的插入引发功能性非编码RNA的形成。
1.3 lncRNA的功能
新一代测序技术的结果表明,基因组具有密集转录的特点,其中80%的转录本为长链非编码RNA,lncRNA被误认为是转录“噪音”,然而lncRNA的一些特征表明它可能直接参与细胞功能的调控:lncRNA通常较长,具有mRNA样结构,经过剪接,具有poly(A)尾巴与启动子结构,分化过程中有动态的表达与不同的剪接方式;lncRNAs启动子同样可以结合转录因子,局部染色质组蛋白同样具有特征性的修饰方式与结构特征;lncRNA的生物功能包括转录调控作用、诱导染色质重塑和组蛋白修饰、调节mRNA选择性剪接模式、产生内源性siRNAs、调节蛋白的活性及结构和组织并且改变蛋白定位、作为小RNA的前体、参与表观遗传调控等[3]。
二、lncRNA与肿瘤
大量研究表明,lncRNA在人类癌症中广泛异常表达,提示其多方面的作用潜在地与疾病的发生相关。lncRNA-n326322在鼻咽癌细胞中表达较高,Du M等[4]通过功能检查发现其过表达会促进NPC细胞增殖和侵袭,反之可抑制NPC细胞的增殖和侵袭。这表明该lncRNA具有促进NPC细胞增殖和侵袭的功能,进一步实验研究发现其潜在机制可能与PI3K / AKT和ERK / MAPK通路的激活有关。Wu J等[5]发现lnc00312通过对细胞周期蛋白B1的下调抑制人肝癌细胞的增殖。因此,除了众所周知的蛋白编码基因和MicroRNA会调节在转录过程中的肿瘤抑制因子和原癌基因相关通路,lncRNA也从转录、转录后和表观遗传学水平在关键性肿瘤信号通路中扮演重要角色,可作为生物标记和新药治疗的靶点。
三、lncRNA与表观遗传学
表观遗传学是指在基因DNA序列没有发生改变的情况下,基因的功能发生了可遗传的变化,并致使表型改变。通常情况下,DNA甲基化与染色质的压缩状态、DNA的不可接近性以及基因沉默状态相关;而DNA去甲基化、组蛋白的乙酰化和染色质去压缩状态,则与转录的启动、基因激活和行使功能有关,这说明,不改变基因的结构而改变基因转录的微环境就能使其沉默,或使其活化。许多ncRNAs非常长,大概50至几百个kb,在大多数情况下,lncRNA的启动子位于各种甲基化印迹控制区域内,此区域位于蛋白质编码基因的序列内[6]。
lncRNA能一直连接在转录的位点上并特异的调节等位基因的表达,对跨度很长的大片段进行调控作用并能对细胞的发育进行精确的时空调控,作为表观遗传的调节因子,对同座及等位基因进行特异性的控制。哺乳动物细胞内lncRNA调控的表观遗传学研究最早起源于基因组印记和X染色体失活,分别与H19和XistRNA密切相关[7]。Susan[8]等运用芯片筛查胚胎干细胞、种系限制性神经前体细胞和末端分化成纤维细胞中lncRNA的表达,从而分析它们的表达与启动子H3K4和H3K27甲基化模式的相关性,结果显示胚胎干细胞中的lncRNA沉默影响组蛋白赖氨酸N端甲基转移酶Ezh2介导H3K27甲基化的过程,揭示lncRNA同一些蛋白编码基因一样扮演着表观遗传调控的角色。
综上,lncRNA在表观遗传学上通过自身表观遗传修饰,改变自身活性,或与其他生物分子形成复合体调控靶基因转录以及调控翻译等过程。
四、生物信息学手段研究lncRNA
4.1 支持向量机方法区分蛋白编码基因与非蛋白编码基因
RIKEN’s FANTOM 项目的完成揭示了前所未知的编码序列,一些未知的转录本也大量浮现,大量RNA并不编码蛋白质,但却被证实具有重要的生物学功能,急需将这部分非编码RNA筛选出作相应的功能注释。为此,Alaei S [9]等引入CONC(coding or non-coding)方法,该方法基于支持向量机,根据特定长度频率的第一开放阅读框的进行主成分分析来预测功能,根据在人、鼠及斑马鱼进行的试验结果显示器预测准确率分别达到98.21%,98.03% and 96.09%,甚至根据不同的模型结合,应用在更多物种上。
4.2 lncRNA功能预测及编码-非编码基因共表达网络建立
尽管越来越多的证据为lncRNA的生物学功能提供了多方位视角,但其确切功能仍然不能拨开云雾见日出,为此,Alaei S[10]等最近报道了基于微阵列基因芯片表达谱建立了编码-非编码基因共表达网络,预测了与食管鳞癌预后生存相关的新lncRNA,数据来源于大量食管癌病人,为以后的进一步研究提供了数据基础。
五、lncRNA相关网络资源
新世纪以来,lncRNA取得了很多引人瞩目的新发展,成为分子生物学研究的热点问题,积累了数十万套lncRNA研究数据,开发了大量RNA网络数据库和应用软件。lncRNA序列数据库主要收集通过实验测序获得的lncRNA序列或对应的基因序列、参考文献、归类注释等信息,常见的数据库如lncRNAdb(http://www.lncrnadb.org/)等,还有一些RNA结构预测软件资源,如Mfold软件。合理应用SRS、Entrez等集成搜索工具可减轻用户检索不同数据源的负担。后期研究lncRNA特征性信息数字化定量表达技术,开发二次挖掘工具,对提高序列结构信息利用效率有重要意义。
总之,LncRNA作为增殖与分化调控通路上的调控分子,在基因的转录、翻译等过程中起重要作用,LncRNA通过与编码基因、非编码基因及其的转录产物等作用,实现调控细胞、组织和器官的分化与发育作用。在表观遗传学方面,LncRNA通过自身的表观遗传修饰,改变自身的活性,或与其他生物分子形成复合体,亦或直接调控靶基因的转录与翻译,以及调控相关蛋白等,该调控作用与疾病(如肿瘤)的发生、发展密切相关,而这方面的研究刚起步,随着研究的深入,将会进一步阐明LncRNA自身的表达与功能以及LncRNA自身的表达反馈调控,推动基因诊断与基因治疗的发展。随着更多高通量筛查技术以及生物信息学的发展,更多具有重要调控功能的lncRNA会被发现。
参考文献:
[1]孙奋勇. 解码基因组中的“暗物质”. 同济大学学报(医学版). 2011. 32(01):1-4.
[2]Ponting CP,Oliver PL,Reik W. Evolution and functions of long noncoding RNAs. Cell. 2009. 136(4):629-41.
[3]Wilusz JE,Sunwoo H,Spector DL. Long noncoding RNAs:functional surprises from the RNA world. Genes Dev. 2009. 23(13):1494-504.
[4]Du M,Huang T,Wu J,et al. Long non-coding RNA n326322 promotes the proliferation and invasion in nasopharyngeal carcinoma. Oncotarget. 2018. 9(2):1843-1851.
[5]Wu J,Zhou X,Fan Y,Cheng X,Lu B,Chen Z. Long non-coding RNA 00312 downregulates cyclin B1 and inhibits hepatocellular carcinoma cell proliferation in vitro and in vivo. Biochem Biophys Res Commun. 2018. 497(1):173-180.
[6]Pandey RR,Mondal T,Mohammad F,et al. Kcnq1ot1 antisense noncoding RNA mediates lineage-specific transcriptional silencing through chromatin-level regulation. Mol Cell. 2008. 32(2):232-46.
[7]Yang PK,Kuroda MI. Noncoding RNAs and intranuclear positioning in monoallelic gene expression. Cell. 2007. 128(4):777-86.
[8]Wu SC,Kallin EM,Zhang Y. Role of H3K27 methylation in the regulation of lncRNA expression. Cell Res. 2010. 20(10):1109-16.
[9]Schneider HW,Raiol T,Brigido MM,MEMT W,Stadler PF. A Support Vector Machine based method to distinguish long non-coding RNAs from protein coding transcripts. BMC Genomics. 2017. 18(1):804.
[10]Alaei S,Sadeghi B,Najafi A,Masoudi-Nejad A. LncRNA and mRNA integration network reconstruction reveals novel key regulators in esophageal squamous-cell carcinoma. Genomics. 2018 .
论文作者:金祖坚
论文发表刊物:《健康世界》2018年6期
论文发表时间:2018/5/29
标签:转录论文; 基因论文; 表观论文; 功能论文; 蛋白论文; 序列论文; 遗传学论文; 《健康世界》2018年6期论文;