英国《自然》杂志首次公布人类蛋白质组草图(ZT)

<small>28日出版的英国新一期《自然》杂志,公布了人类蛋白质组草图绘制工作的里程碑成果:两个小组发表了对人体组织、体液和细胞所做的质谱分析,标绘了人类蛋白质组草图。

如果说基因是描述生命奥秘的图纸,蛋白质就是构成生命的具体建筑材料。在人类基因组草图完成后,科学家尚不能借此完全解释生命现象,因为有些基因信息不会真的表达为蛋白质,而人类的生、老、病、死也只有在蛋白质这个更直接的层面上才能得到解释。因此如果想要阐释人类生命活动及其病理机制的实质,必须绘制人类蛋白组。

上世纪90年代,人类基因组计划开始成形时,有科学家提出了破译人类蛋白质组的想法。其目标是将人体所有蛋白质归类并描绘出它们的特性、在细胞中所处的位置以及蛋白质之间的相互作用。中国科学家在这个工程中,主要负责人类肝脏蛋白组计划。但人类蛋白质组的规模和复杂性使此类研究困难重重。

蛋白质

编码一个蛋白质氨基酸序列的基因的DNA序列

《自然》发表人类蛋白质组草图

日前,两个国际小组在《自然》杂志上分别公布了人类蛋白质组第一张草图,这些在大部分非患病人体组织和器官中表达的精选蛋白,为更好的理解疾病状态下发生的机体变化,奠定了坚实的基础。

约翰霍普金斯大学的Akhilesh Pandey及同事识别出17,294个蛋白编码基因,并通过表达分析提供了存在受组织限制和受细胞限制的蛋白的证据。通过从注解的假基因、非编码RNA和未翻译的区域识别翻译的蛋白,他们显示了“蛋白基因组”分析的重要性。他们的数据集可在www.humanproteomemap.org这个网址获得。

德国慕尼黑工业大学的Bernhard Kuster及同事为“蛋白质组数据库”(ProteomicsDB,可在www.proteomicsdb.org/这个网址获得)中的18097个基因获得了蛋白证据,展示了这种数据的用途—— 如用于识别数百个翻译的lincRNAs和对药物敏感的标记以及用于发现mRNA和组织中的蛋白水平之间的定量关系等。

在本期《自然》的其他地方,Vivien Marx报告了第三个大型蛋白质组项目,即基于抗体的“人类蛋白图集”(Human Protein Atlas)项目。

德国慕尼黑工业大学等机构研究人员报告说,尽管人类已对基因组有所了解,但大约2万个编码基因中,哪些会指导合成蛋白质、合成哪些蛋白质都是未知数。为探明这一问题,他们从人体多个组织样本和细胞系中提取蛋白质并将它们“切”成小块,然后用质谱分析法分析出形成每个蛋白质片段所需的氨基酸序列。

肌球蛋白三维结构的飘带图,其主要由α螺旋所构成

研究人员借助计算机对这些蛋白质片段与基因组进行了大量比对工作,并据此列出一个“清单”,描绘出哪些组织中的哪些基因表达与蛋白质的形成有关。在另一项研究中,美国约翰斯•霍普金斯大学研究人员与印度等国同行也采用质谱分析法绘制出一张蛋白质组草图。

这两个团队均发现,有数百种蛋白质是由此前认为不具备相关功能的DNA片段(脱氧核糖核酸)及“假基因”形成,“假基因”是指由于发生突变,丧失原有功能的基因。此外他们还发现了一些与蛋白质产生无关的“多余”基因。

研究人员表示,绘制人类蛋白质组图谱有助于了解人体内蛋白质的出处、功能和特性,这对于生命科学、医学等领域都有重要意义。而蛋白质组学研究的关键技术包括质谱分析、X射线晶体学、核磁共振和凝胶电泳。

背景资料:蛋白质组学

蛋白质组学主要有两种方法:活体样品研究和重组蛋白合成。在第二种情形下,遗传工程方法被用来克隆待合成的DNA模板,以及把这些基因移植到宿主细胞(典型的是细菌)中,后者被培养用于大规模蛋白表达。

接着,被合成蛋白需要被从宿主细胞中提取和纯化。纯化的蛋白随后通过结晶(及X-射线晶体衍射)或核磁共振来确定其结构。

相比于基因组学,蛋白质组学是更大的挑战,因为蛋白质的三维结构对其功能至关重要。在上述步骤中维持几何形状是重要且具有挑战性的。

国际人类蛋白质组计划(HPP)是继国际人类基因组计划之后的又一项大规模的国际性科技工程。首批行动计划包括由中国科学家牵头的“人类肝脏蛋白质组计划”和美国科学家牵头的“人类血浆蛋白质组计划”。“人类肝脏蛋白质组计划”的总部设在中国首都北京,这是中国科学家第一次领导执行重大国际科技协作计划。

人类之所以在基因组计划之外还要开展蛋白质组计划,是因为人类基因组计划并不像事前所预期的那样,能够逾越蛋白质这一生物功能的执行体层次,揭示人类生、老、病、死的全部秘密。更重要的是,疾病的特征主要表现在蛋白质水平上,许多重大疾病如癌症、心血管病等是多种蛋白共同作用的结果。因此,真正从蛋白质的功能结构上阐明生命活动及其病理机制的实质,才能取得突破性的进展。

从功能基因组学的角度,人们认为每种疾病平均与10种基因相关,而每种基因又与3-10种蛋白质相关。如果以人类主要的100-150种疾病计算,人类蛋白质组中则应该有3000-15000种蛋白质具有成为药物靶标的可能。

此外,国际蛋白质组织启动计划主席萨姆•哈纳什教授说,由于蛋白质组研究将提供大量新“药靶”,许多大制药公司争先加入国际人类蛋白质组计划,希望能够抢先得到最新数据以降低研发成本。

(观察者网综合新华网、《自然》杂志等报道)</small>