蛋白质组:比基因组复杂的多,本文主要内容关键词为:基因组论文,蛋白质论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
如果为你设计房屋的建筑师给你一份由一大堆专门术语和长长的材料清单组成的蓝图,你可能会对你能不能以及什么时候能见到你的新房屋感到疑惑。对于最近(2001年2月)“完成”的人类基因组序列,宣称将给生物学和医学带来革命的“遗传学蓝图”,也使有些人持有相似的保留意见。在对蕴藏其中的基因进行诠释之前,人们是不可能阐明10[7]个核苷酸是如何决定一个酵母细胞的,更不用说3×10[9]个核苷酸是如何决定每个具体的人的存在了。这关键的一步包括弄懂这些基因编码的蛋白质和它们对生命的存在起到什么样的作用。但是理解所有这些蛋白质是如何相互合作以完成各种细胞机制,才是即将到来的真正雄心勃勃的事业。
在全套基因组序列的美妙图景中,有许多东西是基因组学(genomics)不能解决的问题,因而未来是属于蛋白组学(proteomics,也译作蛋白质组学)的:这就是对整套蛋白质的分析。蛋白组学不仅包括对各种蛋白质的识别和定量化,还包括确定它们的(细胞内外的)定位、修饰、相互反应、活性,和最终确定它们的功能。蛋白组学最初的主要技术仅仅是用于蛋白质分离和鉴定的二维凝胶电泳技术,目前蛋白组学却是指对大量蛋白质的集合的研究。这个领域的急剧发展受到了多种力量的驱动:基因组学及其与越来越多新蛋白质的关系;强有力的蛋白质分析技术,例如新建立的质谱仪方法(mass spectrometry approaches)、全局双杂交技术(global two-hybrid techniques)和DNA阵列(DNA arrays)技术在蛋白质分析中的派生技术;以及各种用于处理、分析和解释庞大数据的新颖的计算工具和方法。
人们的思考从基因组学到蛋白组学的转移,是由于充分觉察到研究任务的难度:蛋白质比核酸更加复杂。与貌似具有很大挑战性的DNA不同的是,蛋白质要进行磷酸化、糖基化、乙酰化、遍在化、硫酸化、与糖基化磷脂酰肌醇锚泊蛋白相连接,和许多其他方式的转录后修饰。一个基因可以编码多个不同的蛋白质——这一过程的完成要通过mRNA转录本的选择性剪切、翻译起始位点或终止位点的改变,或者使mRNA翻译中的三联密码发生改变的读框移动等。所有这些可能发生的事件导致蛋白组比之基因组要复杂、庞大许多数量级。(所以,人类基因组的基因数量仅仅是酵母基因数量的6倍可能对蛋白组学家们是一件幸运之事!)而且,蛋白质还会对它所处环境发生的改变进行应答,这些应答包括:改变它们在细胞中的定位、被裂解成片断、调节它们的稳定性、以及改变它们所结合的物质(包括其他蛋白质、核酸、脂质、小分子、或者其他配体)。蛋白质的水平经常并不反映mRNA的水平,即使是存在一个开放读框也不能保证存在一种蛋白质。最后,一种蛋白质可以与不止一种(生化)过程有关,相反,不同的蛋白质可以完成相同的功能。