人类蛋白质组研究的前瞻与反思,本文主要内容关键词为:蛋白质论文,人类论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
自1995年蛋白质组概念的提出,至今已13年,人类蛋白质组组织(HUPO)成立也7年。蛋白质组研究已是生命科学中“热点中的热点”。而一项更雄心勃勃的人类蛋白质组计划正在酝酿中。
人类蛋白质组计划的新篇章
2008年4月24日的英国《自然》杂志有一则新闻,题为《生物学家启动一个勾画人类蛋白质组的计划》[1]。此项计划由HUPO前任主席伯杰龙(J.Bergeron)等草拟。他们在2008年1月开过两次预备会,并在8月的HUPO世界大会上广泛征询意见。
HUPO的宗旨是实施人类蛋白质组计划(HPP),即在人类基因组计划后继续相关研究,解析人体中所有基因的产物——蛋白质,进而揭示生命活动的奥秘。2001年以来,先后推出了多项计划,包括人类血浆蛋白质组计划(HPPP)、人类肝脏蛋白质组计划(HLPP)、人类脑蛋白质组计划(HBPP)、小鼠和大鼠蛋白质组计划(MRPP)等。之所以启动这些局部的蛋白质组计划,是考虑到蛋白质远比基因复杂得多,一个基因可以产生多种蛋白质。更有甚者,在人体内多达200余种细胞中,这些蛋白质在不同时刻以不同水平制造。为此,将人体蛋白质组解剖为一些组织或体液的蛋白质组。MRPP则是用模型生物进行演练。
这次提出的人类蛋白质组计划去除了任何修饰词,实实在在是对人类蛋白质组的一次大规模的、“短兵相接的肉搏”(assault)。最终目的是对所有的人体蛋白质进行归类(catalogue)和表征。那么,为何在HUPO成立7年后才提出这个计划?因为曾经认为人体蛋白质的总数约50000种,或更多,但是现在则认为仅21000种左右,在实施上已有一定的可操作性。尽管这项计划是对人体蛋白质组的一场总攻,但依然将问题简化,即只考虑一个基因产生一个蛋白质。
按照伯杰龙等人的设想,这一计划从三方面进行:一是用质谱分析法鉴定各组织中的蛋白质及其数量:二是用针对每种蛋白质的抗体,确定蛋白质在组织和细胞中的定位;三是系统地鉴定每一种蛋白质与哪些其他蛋白质存在相互作用。伯杰龙认为,具体的工作将由全世界的实验室分别承担,整个过程可能要用10年。这项计划预计耗资10亿美元,它能否获得足够支持、能否筹到所需款项尚属未知。但有关人员坚信,考虑到计划的重要性,相关费用微不足道。但是,在启动这个宏伟计划前,一定要显示其临床的意义。
《自然》杂志的编者对此新闻加了按语,题为“The big ome”(大的组)[2],除了介绍完整崭新的人类蛋白质组计划,说明其重要意义(涉及的主要仍是疾病的防治和有关药物开发)外,有一些论点很独到。
创建蛋白质生物学
《自然》杂志的编者认为蛋白质往往被贴上“世俗”(mundane)的标签,而且这种世俗的观念是“世界”(mundane的另一个含义)性的。这个世界性的世俗观念来自遗传学中心法则:DNA→RNA→蛋白质。这样,蛋白质始终在DNA的阴影下,蛋白质组甫一诞生就被普遍认为是基因组的延伸。例如,某行家在蛋白质组专业会议的大会报告中侃侃而谈:“结构基因组学主要是针对一些重要的生物体系,通过基因和蛋白质序列比较分析,对蛋白质加以分类,并从中找出具有独特功能和结构的新蛋白质。”这样,结构基因组学研究的不是基因和基因组的结构,而是新蛋白质的结构。类似地,蛋白质的功能研究也被看成是功能基因组的研究内容。
因此,编者指出,要真正开展完整的人类蛋白质组计划,就要使蛋白质组的研究从基因组的阴影下解放出来,不只是将蛋白质作为“细胞中的工役之马”(在编者按中用了“cell's work-horses”一词,值得深思!),而是要使蛋白质研究上升到“蛋白质生物学”层次,即使蛋白质研究成为生物学的一个分支学科。这必将触动学术界,并将面临一场艰苦战斗。
就在《自然》杂志的新闻和编者按刊出后不久,《科技日报》登载了一篇题为《蛋白质组破译:打开解密“天书”的通道》的文章。望文生义,这里的“天书”仍是世俗的基因组,而蛋白质组的破译,只是解密基因组的工具。由此可见一斑,蛋白质的研究要成为生物学的一个分支——蛋白质生物学,谈何容易!
总之,即将翻开的人类蛋白质组计划的新篇章,其实质决不应理解为简单的技术工作,不是找一些疾病的分子标志物,也不仅是开发治疗某些疾病的新药,而是要全面提升对蛋白质研究重要性的认识,创建蛋白质生物学。
建立完整的蛋白质组
HUPO成立以来,启动的各项计划都是局部的,这次提出了一个更为全面的计划,是从整体考虑。此前以“解剖”为前提的研究,化整为零,对深入研究有利,不利之处则是不能对人体全部蛋白质有全面的认识。例如,某些蛋白质存在于多种组织和器官中,且以同工蛋白质的形式出现。又如,一些内分泌系统合成的蛋白质和(或)肽类激素却以其他远程组织和器官为靶标。因此,只有综合进行人类蛋白质组研究才能深刻揭示蛋白质在人体中的作用。
需要指出的是,当前蛋白质组研究的对象除了血浆外,几乎全是细胞。然而,在高等生物体中,如果没有细胞外的基质,光是一群细胞无法构成组织和器官。为此,基质生物学(matrix biology)[3]曾被视为细胞生物学的补充。
笔者于2007年10月2日在数据库PubMed(美国国家医药图书馆数据库)查询到的文献中,2001年题为《蛋白质组学——结缔组织生物学相关的蛋白质表达技术》(Proteomics-the protein expression technology to connective tissue biology)的论文是第一篇以细胞外基质为对象进行蛋白质组研究的文章。此后,在PubMed上能查询到的相关文章仅74篇。其实,细胞外基质的蛋白质组可覆盖的面极其宽广。大而言之,与病理学和分子病理学、分化与发育生物学等生物学和医学的很多分支学科密切相关。小而言之,可将细胞外基质作为亚细胞器看待。
在不少情形下,基质对细胞产生明显影响,且这样的影响表现在很多生理和病理过程中。干细胞的分化就是个典型例子。“人之初性本善”还是“人之初性本恶”之争,似乎不应忘了环境的影响。
基质受到干扰,可以作为对细胞的应激,这少有人考虑。从事植物细胞研究的学者已考虑到细胞壁受损后,对植物细胞产生应激;但是从事动物细胞研究的学者,则很少会考虑到基质的破损会对动物细胞产生应激。这种现象和效应,称其为生物学中的“测不准原理”也未尝不可。
既然细胞生物学和基质生物学是姐妹篇,那么,仅研究细胞而不研究基质,则对机体描绘的图景、述说的故事都是不完全的。因此,以细胞外基质为对象的蛋白质组研究肯定对目前的诸多“热点”研究具有推动作用。
其实,开展基质蛋白质组的研究非常简单。由整体或组织得到细胞的过程中,要去除细胞外基质。由于着眼点是细胞,因此,很好的研究材料就被作为“垃圾”废弃了。殊不知,被丢弃的“垃圾”恰恰是基质蛋白质组研究可用的材料。
除了基质蛋白质组外,可能还有一些被人们忽视甚至遗忘的“冷点”,在这一次“The big ome”中均不应受到冷遇。
不同关键词在PubMed中检索到蛋白质组的文献数
检索关键词
文献数
蛋白质组 9321
蛋白质组—分析
7033
蛋白质组—基因组 2594
蛋白质组—诊断
1761
蛋白质组—疾病
1289
蛋白质组—生物信息学 1056
蛋白质组—生物标记物 873
蛋白质组—治疗546
结构蛋白质组 619
蛋白质组—磷酸化 452
蛋白质组—糖蛋白 337
蛋白质组—细胞外基质
74
蛋白质组—相互作用物组 63
对近年蛋白质组研究的分析
笔者在PubMed数据库查询到的文献中,以蛋白质组(proteome)为关键词检索到的文章约9321篇。以蛋白质组—分析(proteome,analysis)等关键词组合的方式进行检索得到了非常有趣的结果。从检索结果中可看出迄今蛋白质组研究的总体格局:(1)分析技术和方法是主体,约有45%的研究论文使用了质谱;(2)分析的对象主要是与基因组研究和疾病研究有关的材料,尤其是希望发现能用于疾病诊断的标记物和开发药物用的蛋白质靶标;(3)生物信息学是不可或缺的工具。与此格局相应的,目前从事蛋白质组研究的人员主要来自四个方面:原先从事基因组研究的学者;长期从事重大疾病研究的人员;分析化学的专家;生物信息学家。由此得到的另一个信息是,过去从事经典蛋白质研究的人员参与蛋白质组研究的却不很多,至少在国内似乎如此。
如果上述分析没有很大偏差的话,则至少在目前蛋白质组研究中蛋白质含量似乎少了些,如果长此以往,蛋白质组不可能发展成为蛋白质生物学,最终蛋白质组及相关研究只是一种在生物学中可被广泛使用的技术。
蛋白质组的高通量研究与复合体的研究
蛋白质组等“组”的研究需要高通量,然而,除了分离和局部的分析鉴定外,目前蛋白质组研究的很多方面,例如,各组分立体结构的测定(目前普遍称为结构蛋白质组)、各组分功能的确定(即功能蛋白质组)、各组分的相互作用〔相互作用物组(interactome)[4]〕等都没有达到高通量的要求。尤其是相互作用物组的研究,如果缺乏整体观,在各组分彼此分离的基础上,开展相互作用物组的研究则难以想象。也许是蛋白质组研究是从二维凝胶电泳开始的,致使不少人认为蛋白质组的各方面研究一定要从分离开始。
目前,在复合体的研究上已取得巨大突破,对细胞内蛋白质合成的分子机器——核糖体的整体研究就是明显的例证。核糖体是一个由七八十个蛋白质与rRNA(核糖体RNA)组成的复合体。完整的核糖体,或经结晶,或制成颗粒,分别利用晶体衍射技术和冷电镜技术[5],可得到完整核糖体的结构图景[6]:不仅可“看到”蛋白质之间相对位置,还可“看到”个别蛋白质中局部的立体结构。对核糖体复合体的深入系统研究,必将能同时揭示其中许多蛋白质的立体结构,即开展结构蛋白质组的高通量研究,同时了解其中一些蛋白质的相互作用,即实施了蛋白质组相互作用的研究,甚至还可得到一些蛋白质功能的信息,即进行了功能蛋白质组的研究。有关的技术也开始应用于其他蛋白质复合体的结构与功能的研究。
当前蛋白质组的研究,要摆脱以高通量分离开始的“传统”观念。不仅是“天下合久必分,分久必合”,而且科学研究和研究的思维也是如此,分分合合,合合分分。目前的主要问题是,如何提高研究复合体的晶体衍射和冷电镜技术的分辨率,以利于复合体中各组分结构细节的检测,进而高通量地测定复合体中更多蛋白质的精细结构,这必将推动蛋白质相互作用和蛋白质功能的研究。
蛋白质组与蛋白质组学
“组”和“组学”是不同层次却又相互依存的两个概念,然而常被混淆[7],似乎“蛋白质组”就是“蛋白质组学”,反之亦然。殊不知,一个“学”字有多重,有必要咬文嚼字,正本清源。“蛋白质组”只是一群蛋白质的集合,仅是一个表象,犹如户口在上海的人群。一个细胞中蛋白质组的二维凝胶电泳,犹如按年龄和体重将上海人列队。进一步调查,则应了解每个人的学历、职业、工作技能、彼此间是否有亲缘关系。即便是对每个人的性格爱好全都记录在案,也只是个人的档案。蛋白质组的研究,即使是结构蛋白质组、功能蛋白质组,也只是一个集合中各组分的各自档案。“蛋白质组学”则迥然不同,要研究的不只是各个蛋白质各自的档案,还要知道从细胞到组织、器官,乃至生物体,它们如何协同与协调而构成一个活体的。对上海人的全面的了解类似于“蛋白质组”的研究;阐明这些上海人是如何构成上海这样一个社会化的大城市的,则相当于“蛋白质组学”。
因此,要使蛋白质组的研究发展成为蛋白质生物学,必须有整体观念,必须使蛋白质组层次的研究提升到蛋白质组学的层次。着眼的不是技术,而是蛋白质本身;考虑的不只是作为疾病指标的或作为药物靶标的某个或某几个蛋白质,而是各种“社会化”的蛋白质,以及它们的“社会化”。
蛋白质组与传统生物化学的比较
蛋白质的研究始终是传统生物化学的研究对象。传统生物化学中的蛋白质研究方法与目前的蛋白质组或组学的方法有天壤之别。在方法远比现在落后的条件下,先辈们取得了卓越成就,不少人还得到了诺贝尔奖。他们靠的不只是当时的仪器设备,更重要的是靠了他们的才智和严密的思维。
目前蛋白质组研究的方法,强调高通量,求多求全。而且还希望在又多又全的蛋白质组中发现某些疾病的生物标志物和药物靶标,这也许可比喻为在茫茫人海中找一个不相识的人。在比较蛋白质组研究中,有时能发现一些量上明显增多的蛋白质。然而,这些蛋白质在细胞内的定位不同,它们的功能又不相关。这又像在人海中找到了很多职业不同而且无关的人,他们聚在一起能完成特定的使命吗?
传统生物化学的研究从来没有满足于对单个蛋白质的研究,并有明确的目标:阐明生命是如何活动的,在有关过程中,有哪些分子参与,它们之间的关系又如何?在这样的思想指导下,先辈们利用严格的逻辑思维,大多采用顺藤摸瓜的方法,由此及彼,孜孜不倦地构筑蛋白质体系。虽然没有现今的蛋白质组那样庞大宏伟,但是也发现了许许多多的体系、代谢途径和网络,构筑了生物化学的框架。先辈们的效率其实并不低。例如,莱宁格(A.Lehninger)及其同事在1943-1950年间,先证明了脂肪酸氧化需要腺苷三磷酸(ATP),而后又发现三羧酸循环、脂肪酸氧化以及氧化磷酸化是在线粒体中进行的。又如,各种氨基酸、嘌呤和嘧啶等碱基、脂肪酸和萜类化合物的生物合成与降解的酶促过程,是在1950-1965年这十多年中完成的。
1995-2007年,生物化学和分子生物学也取得了长足发展,取得了一系列进展,人们最容易联想的就是基因组的研究。然而,全世界如此巨大的投入,基因测序的结果中却有90%以上是“垃圾基因”。其他诸多的进展又有多少是在蛋白质组或组学,以及其他各种各样组或组学的研究基础上得到的?值得分析反思。应该对这12年来各种各样组或组学的研究与1950-1965年这15年间生物化学基础分子的代谢研究作个比较。
笔者的结论是,经典生物化学的研究模式是成熟的“老人”风格,严格的逻辑思维为主,用脑做实验,按部就班,稳扎稳打;现今的蛋白质组研究模式是勇猛的“年轻人”作风,以先进仪器为主体,用手作实验,速战速决,想立竿见影。这两种模式各有所长,各有所短。最佳的组合是“老中青”结合;在使用先进仪器的同时,更多运用思维,是使用仪器,而不是依赖仪器。
立足蛋白质
从前文中提到的蛋白质组研究的队伍组成,已可看出研究的主力,多数、甚至绝大多数不是蛋白质起家的,至少从国内和笔者周围接触的人看是如此。一些进入蛋白质组研究的基因组干将,多年从事重大疾病的专家和分析化学中的精英,他们对蛋白质的基本概念并不都“吃透”。
在进行蛋白质组实验时,不应满足于高通量的分离和鉴定,而应着眼于高通量的分拣(sorting),这样才能“沙里淘金”。通用的蛋白质组研究技术,无法得到“金子”,只能发现一些“量”上变化大的蛋白质。发现金子需要“慧眼”——能特异拣出特定蛋白质的特异方法。这次提出的人类蛋白质组计划,强调编目式的归类(catalogue)非常重要。
为此,在进行蛋白质组研究时,一定要以蛋白质功能为指导,由此产生了相互作用物组和化学蛋白质组(chemical proteome)[8]。单纯的蛋白质组分离和鉴定研究得到的结果基本是“死的”。例如,多维层析—质谱联用技术分析的经常不是完整的蛋白质而是酶解的肽段。化学蛋白质组和相互作用物组,则多少有些“生气”。要将蛋白质组或组学搞活,仅用仪器,即使是高级仪器,而没有蛋白质的基本知识和概念是不行的。蛋白质的结构和功能多变,没有基因组研究中固有的通用模式,必须针对不同情况进行具体分析。如果确实想在蛋白质组或组学研究中,开展系统和卓有成效的研究,投身于蛋白质组研究的各类人员,首先应该进入蛋白质一行。
“台下十年功,台上一分钟”。在分析化学中同样存在这样的情况,即样品前处理耗去的时间和投入的精力远超过最后在高级仪器上进行分析的时间、精力和经费。前处理得当,可以事半功倍;反之,则事倍功半。而样品的前处理并不为一般的分析化学家所熟悉,他们擅长的是高级仪器的使用,他们所分析的是最后纯的样品,而非“杂乱无章”甚至“鱼目混珠”的粗样品。长期从事“正向”蛋白质研究的人,恰恰最善于蛋白质样品前处理。因为正向研究蛋白质的人,是在蛋白质的混合物分离得到纯品后,进行全面研究,其中包括编码蛋白质的基因;而所谓“反向生物学”的蛋白质研究,却是绕过复杂的样品前处理,直接从基因出发得到纯蛋白质,然后开展蛋白质研究。由于“反向生物学”的提出,蛋白质分离纯化和前处理的基本功正在面临“失传”的危机。
总之,就全局而言,蛋白质组(组学)正在由孩提时代进入青年时代,在对蛋白质组(组学)研究进行前瞻的同时,有必要进行回顾和反思。