首页 > 新闻 > 科研新闻 > 正文 | 字号选择: |
植物蛋白质组学研究进展 |
作者:梁宇 荆玉样 沈世华 |
出处:见正文 | 发布时间:2004-8-27 9:22:26 (原作发表时间: ) |
1 蛋白质组学概念、内容及其产生背景 1.1 蛋白质组学的概念 蛋白质组(Proteome)一词是由英文单词蛋白质(Protein)的前半部分加上基因组(Genome)的后半部分组合而成,它是指基因组表达产生的所有相应的蛋白质,即细胞或组织或机体全部蛋白质的存在及活动方式(Wasinger等,1995年)。蛋白质组学(Proteomics)一词是由澳大利亚学者威尔金斯(Marc Wilkins)和威廉姆斯(Keith Williams)在1994年意大利召开的一次科学会议上首次提出,并由Wasinger等(1995年)第一次在出版物中使用。蛋白质组学是以蛋白质组为研究对象,从整体蛋白质水平上,在一个更加深入、更加贴近生命本质的层次上去探索和发现生命活动的规律和重要的生理、病理现象等。 1.2 植物蛋白质组学的研究内容 蛋白质组学研究主要包括蛋白质的表达模式和蛋白质的功能模式两个方面。 蛋白质表达模式的研究是蛋白质组学研究的基础内容,主要是研究特定条件下某一细胞或组织的所有蛋白质的表征问题。常规的方法是提取蛋白质,经2D-E(Two-dimensional electrophoresis)分离形成一个蛋白质组的二维图谱,通过计算机图像分析得到各蛋白质的等电点、分子量、表达量等,再结合以质谱分析为主要手段的蛋白质鉴定,建立起细胞或组织或机体在所谓“正常生理条件下”的蛋白质组图谱和数据库。然后,在此基础上,可以比较分析在变化了的条件下蛋白质组所发生的变化,如蛋白质表达量的变化、翻译后的加工修饰、蛋白质在亚细胞水平上定位的改变等,从而发现和鉴定出特定功能的蛋白质及其基因。 蛋白质功能模式的研究是蛋白质组学研究的重要目标。无论是基因组研究还是蛋白质组研究,最终目标是揭示所有基因或蛋白质功能及其作用模式。一方面,蛋白质与蛋白质、蛋白质与DNA之间的相互作用、相互协调是细胞进行信号传导及代谢活动的基础。另一方面,蛋白质的结构是蛋白质发挥其功能的前提,对蛋白质结构的认识也成为了解大量涌现的新基因功能的一个重要途径。 1.3 植物蛋白质组学的产生背景 植物蛋白质组学是在基因组学的研究成就和高通量的蛋白质分析技术得到突破的背景下产生的新兴学科,基因组研究的发展是蛋白质组学产生的重要前提。 基因组研究是生物科学近十几年来的研究热点。人类基因组计划被誉为20世纪的3大科技工程之一,并取得了辉煌的成就。2000年6月科学家公布人类基因组工作草图(MacilWain等,2000年),标志着人类在解读自身“生命之书”的路上迈出了重要一步。2001年2月,中、美、日、德、法、英等6国科学家和美国塞莱拉公司联合公布人类基因组图谱及初步分析结果(Lander等,2001等),宣告了一个新的纪元——后基因组(即功能基因组)时代的到来。 植物基因组学的研究主要集中在拟南芥(Arabidopsis thaliana)和水稻(Oryza sativa)两种模式植物上。2000年12月,美、英等国科学家宣布测出拟南芥基因组的完整序列(The Arabidopsis Genome Initiative, 2000年),这是人类首次全部破译高等植物的基因序列。2002年是水稻基因组学研究取得重大成就的一年,首先中国的科学家和Syngenta公司的科学家分别发表籼稻和粳稻基因组“工作框架图”(Yu 等,2002年;Goff等,2002年),继后日本和中国的科学家又分别公布了粳稻第1号和第4号染色体的全序列(Feng 等;Sasaki等,2002年)以及籼稻粳稻基因的“精细结构图”,被认为是基因组学研究的又一个重要里程碑。 基因组密码的破译,拉开了生命科学研究的序幕,但是,要真正揭示生命活动的奥秘,基因组研究本身又无能为力。因为,基因组仅仅是遗传密码和遗传信息的载体,在生命活动的不同过程中恒定不变,不能反映有机体在生命活动过程中基因表达的时空关系和网络调控。在后基因组时代,研究重心转移到基因功能的解析,即利用结构基因组所提供的信息和高通量的实验手段在转录组(Transcriptome)和蛋白质组水平上系统地分析基因的功能(Oliver,2000年)。 拟南芥和水稻的功能基因组学研究已经开始,其中美国和日本科学家做了大量的工作。其它植物如玉米(Touzet等,1996年)、小麦(Weiss等,1997年)、苜蓿(Catoira等,2000年)、松树(Costa等,1999年)等的功能基因组学研究也已经有人涉及。 蛋白质是基因功能的体现者和执行者。现在已经证明,一个基因并不只产生一个相应的蛋白质,它可能会产生几个,甚至几十个蛋白质。机体所处的不同环境和本身的生理状态差异,会导致基因转录产物有不同的剪切和转译成不同的蛋白。蛋白再进行加工修饰和转移定位,才具有活性和生物功能,产生相应的生理作用,适宜相应的生存环境(Li和Assmann,2000年)。在转录水平上所获取的基因表达的信息并不足以揭示该基因在细胞内的确切功能。直接对蛋白质的表达模式和功能模式进行研究就成为生命科学发展的必然趋势。因此,研究基因组编码的全蛋白质功能及其相互作用关系的蛋白质组学应运而生(Anderson 和 Anderson,1998年)。尽管蛋白质组学在20世纪90年代中后期才出现,但由于学科的前沿性和巨大的应用市场,《Nature》、《Science》杂志在公布人类基因组序列草图的同时,分别发表了述评和展望,将蛋白质组学的地位提到前所未有的高度,认为它是功能基因组学前沿研究的战略制高点和新世纪最大的战略资源——“有用基因”争夺战的重要“战场”(Kaiser,2000年;MacilWain,2000年)。 2 蛋白质组学的研究方法 蛋白质组学研究方法和技术有很多,并且不断发展和出现新的技术。本文限于篇幅,只能简要介绍主要的蛋白质组学研究技术。 2.1 双向聚丙烯酰胺凝胶电泳(2D-PAGE) 2D-PAGE方法的应用始于20世纪70年代(O'Farrell等,1975年),但迄今为止,它仍然是分离蛋白质的最有效的方法。与基因组研究不同的是,蛋白质组学并没有类似于PCR反应的扩增方法,因此,分离样品的精确性就成了至关重要的问题。目前常用的大规格胶(20cm×20cm)是可再生的,并且借助于考马斯亮蓝和银染,可以对蛋白质进行定量;应用荧光染料,还可以使一定范围内的上千种蛋白质定量地显现出来,这些都大大提高了2D-PAGE的精确性(Steinberg等,1996年),当然2D-PAGE技术还远远没有达到完善的地步,例如要使低水平表达的蛋白质(即“低拷贝数蛋白质”,每细胞10~1000个拷贝)显现出来仍有困难,而高水平表达的蛋白质(即所谓“管家蛋白质”,每细胞大于1000个拷贝)有时也会出现小部分的模糊。最近一些2D-PAGE相关技术,如高度敏感的质谱(Mass-spectrometric)和EST数据库的发展,使分离和鉴定蛋白质的工作又大大前进了一步。 2.2 质谱(Mass-spectrometric)技术 质谱技术是近年来蛋白质组学研究最重要的技术突破之一(Pandey和Mann,2000年),其原理是将样品分子离子化,根据离子间质荷比(m/z)的差异来分离并确定质量,是高灵敏度高特异性地快速鉴定生物分子的技术。质谱测定中首先将通过2D-PAGE分离到的蛋白质用特定的蛋白质酶(例如胰蛋白酶)消化成肽段,然后用质谱仪进行分析。 质谱鉴定有两条主要途径。一是“肤链质量图谱”途径。测量质谱的方法是基质辅助激光解吸附/电离法(Matrix-assisted laser desorption/ionization, MALDI),通过测定一个蛋白质酶解混合物中肽段的电离飞行时间来确定其分子量等数据,所以也称为基质辅助激光解吸/电离飞行时间质谱法(MALDITOF),最后通过相应的数据库搜索鉴定蛋白质(Berndt等, 1999年)。随着数据库中的全长基因序列越来越多,MAIDI鉴定的成功率也越来越高。二是串联质谱途径,将胰蛋白酶消化后的蛋白质单个肤链直接从液相经“电喷离子化”而被电离,分解为氢基酸或含有C末端的片段,片段化离子被喷射到“串联质谱仪”进行质量测定,以得到序列信息。它的主要优点是:对鉴定蛋白质来说,由几个肽链片段化得到的序列信息比一系列的肽链质量更具有特异性(Pandey等,2000年)。片段的数据不仅可以在蛋白质序列数据库中搜寻,还可以在核酸数据库,例如EST数据库,甚至原始的基因组数据库中搜寻。 最近发展起了一种新型的质谱仪,它将MALDI离子源与高效的串联质谱仪系统结合起来(可将单个肽链片段化)(Shevchenko等,2000年),把高产量的肽链图谱法与高特异性的肽链序列法结合起来。并将两步的质谱分析合并为一步。质谱技术还可用于蛋白质磷酸化、硫酸化、糖苷化以及其它一些修饰的研究(Pandey等,2000年)。 2.3 蛋白质芯片(Protein chips)技术 蛋白质芯片技术是一种高通量、微型化和自动化的蛋白质分析技术。在蛋白质芯片技术途径中,首先将一系列的“诱饵(Bait)”蛋白质(如抗体)按照一定的排列格式固定在经特殊处理的材料表面上(Lueking等,1999年)。然后以我们感兴趣的样品为探针来探查该表面,那些与相应的抗体相结合的蛋白质就会被吸附在表面上。而后把未与抗体结合的蛋白质洗掉,把结合的蛋白质洗脱下来,经凝胶电泳之后通过质语法进行鉴定。这种技术实际上是一种大规模的酶联免疫分析。可以迅速地将我们感兴趣的蛋白质从混合物中分离出来,并进行分析。蛋白质芯片上的“诱饵”蛋白可根据研究目的不同,选用抗体、抗原、受体、酶等具有生物活性的蛋白质。 蛋白质芯片要比DNA芯片复杂得多。芯片制作过程中保持蛋白质的生物活性,成为限制蛋白质芯片发展的瓶颈技术。近年来,在蛋白质芯片制作方面获得突破性进展(MacBeath和Schreiber,2000年)。对蛋白质芯片的检测可以通过对不同状态细胞的蛋白质进行荧光标记,从测定荧光的强度上可以得知结合在抗体上的蛋白质的富集程度。或直接利用MALDI/MS技术检测结合到芯片上的物质来检测(Davies等, 1999年)。 蛋白质之间的相互作用是蛋白质组研究中的一个关键问题(Blackstock等,1999年),将直接导致我们对蛋白质的生物功能的了解。蛋白质芯片技术可被用来进行这方面的研究。将饵蛋白固定在固相支持物上,用蛋白质混合物进行探查。把未与诱饵蛋白结合的蛋白质洗掉,把结合的蛋白质洗脱下来,经凝胶电泳分离之后,通过质谱法进行鉴定。这样,在一个实验中,与诱饵蛋白相互作用的所有蛋白质都可以被鉴定(Neubauer等,1998年)。蛋白质芯片能够同时分析上千种蛋白质的变化情况,使得在基因组水平研究蛋白质的功能(如酶活性、抗体的特异性、配体-受体交互作用以及蛋白质与蛋白质或核酸或小分子的结合)成为可能。 2.4 酵母双杂交系统(Yeast two-hybrid system) 酵母双杂交系统正成为研究蛋白质间相互关系的有力工具。其理论基础是转录因子的结构模型,即当转录因子的DNA-结合结构域与激活结构域紧密结合以后,将导致一系列基因转录的增加。酵母双杂交系统利用转录因子GAL4的DNA-结合结构域(GAL4-BD)与激活结构域(GAL4-AD)的特异载体,将许多开放阅读框架(ORFs)分别连在这两种载体上,构成文库,然后转入酵母细胞,并与酵母细胞克隆杂交。当其中两个0RF编码的蛋白质在酵母细胞中表达,并发生相互作用时,就会将GAL4-BD和GAL4-AD结合在一起,从而导致报告基因转录的增加。通过培养基营养缺陷筛选法,可将没发生相互作用的酵母克隆筛选掉,而将发生相互作用的酵母克隆保留下来。然后对发生相互作用的蛋白质进行分析,通过测序就可以鉴定0RF。因此,酵母双杂交系统对大规模筛选分析蛋白质间的相互作用来说是一项简便易行的方法。 酵母双杂交系统的具体应用可分为两种方法,即阵列法(Array method)和文库筛选法(Library screening method)(Pandey等,2000年)。用阵列法鉴定了192个ORF,文库筛选法对87%的酵母基因组进行了研究。总共发现了957个可能的相互作用的蛋白(Walhout等, 2000年)。另一个研究组分析了10%的酵母基因组,发现了183个可能的相互作用蛋白(Ito等,2000年)。上述两项大规模研究所发现的蛋白质间的相互作用大多数是新的。但是利用酵母双杂交系统的研究工作仅仅是潜在的蛋白质间的相互作用,结果还需要进一步的生物学实验验证或者排除。Vidal和Endoh(1900年)对酵母双杂交系统的改进,叫做“反向”双杂交,它可被用来鉴定破坏蛋白质间相互作用的复合物和肽链。 2.5 植物蛋白质组数据库 目前标准而且可重复的2D-PACE蛋白质分析方法使得大规模的蛋白质组研究成为可能,再加上其它技术的辅助(如蛋白质免疫检测、微序列分析、质谱等),可以使我们获得大量的蛋白质表达的信息。这些信息可以贮存在蛋白质数据库中,并与其它数据库相联接。 目前的数据库集中在模式植物拟南芥,重要的粮食作物水稻、玉米,以及松树等植物上,这些数据库都提供可以点击的2D-PAGE图像,还包括植物各器官(根、茎、叶、芽、种子)、各组织(愈伤组织、木质部、韧皮部)或基因型间多肽形式的比较。 蛋白质组数据库的一个重要特征是它们建立了与基因组计划的联系。目前的蛋白质组数据库所包含的植物都是已完成或正在进行系统测序的物种。有的是在基因组水平(如拟南芥、水稻),有的是在转录组水平(如拟南芥、玉米、水稻、松树的表达序列标签ESTs)。有趣的是在拟南芥原生质膜蛋白质数据库中发现许多蛋白质与未知的ESTs相关联,这为研究在亚细胞水平表达的蛋白质的编码基因提供了第一手资料。利用蛋白质组数据库和ESTs数据库,第一次将植物中的转录本与相关的蛋白质联系了起来。(未完待续) 注: (浏览次数:4530)
|
上篇文章 | 下篇文章 | 相关文章 | 推荐给朋友 | 打印 | 关闭窗口 |
友情链接: |
|
Copyright © 2003 CNRRI. All rights reserved. 中国水稻研究所 版权所有 地址:杭州市体育场路359号(邮政编码:310006) E-mail:[email protected] |