蛋白质结构解析六十年

[2015/7/2]

  上个世纪初,科学家们认为蛋白质是生命体的遗传物质,而具有独特的作用。随着这个理论被证伪,真正的遗传物质DNA的结构被给予了很大关注。然而,蛋白质作为生命体的重要大分子,其重要性也从未被忽视,而且在1950年代开始,科学家一直在探寻DNA序列和蛋白质序列的相关性。与此同时,蛋白质测序和结构解析蛋白质结构的努力开始慢慢获得回报。更多的生化研究揭示了蛋白质的功能重要性,因此蛋白质的三维结构的解析对于深入理解蛋白质功能和生理现象起着决定性作用。

  蛋白质结构解析六十年来大事件

  在1958年,英国科学家John Kendrew和Max Perutz首先发表了用X射线衍射得到的高分辨率的肌红蛋白Myoglobin的三维结构,然后是更加复杂的血红蛋白Hemoglobin。因此,这两个科学家分享了1962年的诺贝尔化学奖。事实上,这项工作在早在1937年就开始了。

  然后在1960年代,蛋白质结构解析方法不断进步,获得了更高的解析精度。这个时期,蛋白质序列和DNA序列间关系也被发现,中心法则被Francis Crick提出,然后科学界见证了分子生物学的崛起。分子生物学(Molecular Biology)的名称在1962年开始被广泛接受和使用,并逐渐演变出一些支派,如结构生物学。然后在1964年,Aaron Klug提出了一种基于X射线衍射原理发展而来的全新的方法电子晶体学显微镜(crystallographic electron microscopy ),可以解析更大蛋白质或者蛋白质核酸复合体结构。因为这项研究,他获得了1982诺贝尔化学奖。1969年,Benno P. Schoenborn 提出可以用中子散射和原子核散射来确定大分子中固定位置的氢原子坐标。

  进入1970年代,很多新的方法开始发展。存储蛋白质三维结构的Protein Data Bank(1971年) 开始出现,这对于规范化和积累蛋白质数据有着重要意义。1975年新的一种仪器叫做多丝区域检测器,让X-ray的检测和数据收集更加快速高效。次年,Robert Langride将X-ray衍射数据可视化,并在加州大学圣地亚哥分校成立了一个计算机图形实验室。同年,KeithHodgson和同事首次证明了可以使用同步加速器获得的X射线并对单个晶体进行照射,并取得了很好的实验效果。然后在1978年,核磁共振NMR首次被用于蛋白质结构的解析;同年首个高精度病毒(西红柿丛矮病毒)衣壳蛋白结构被解析。

  在1980年代,更多蛋白质结构被解析,蛋白质三维结构的描述越来越成熟,而且蛋白质结构解析也被公认成为药物研发的关键步骤。在1983年,冷冻蚀刻的烟草花叶病毒结构在电子显微镜结构下得到描述。两年后德国科学家John Deisenhofer等解析出了细菌光合反应中心,因此他们共享了1988年的诺贝尔化学奖。次年,两个课题组解析了HIV与复制相关的蛋白酶结构,对针对HIV的药物研发提供了理论基础。

  下一个十年,因为大量同步加速器辅助的X射线衍射的使用,数千个蛋白质结构得到解析,迎来了蛋白质结构组的曙光。1990年多波长反常散射方法(MAD)方法用于X射线衍射晶体成像,与同步辐射加速器一起,成为了近二十多年来的最常用的的方法。Rod MacKinnon在199年发表了第一个高精度的钾离子通道蛋白结构,对加深神经科学的理解起了重要作用,因此他分享了2003年的诺贝尔化学奖。Ada Yonath等领导的课题组在1999年首次解析了核糖体结构(一种巨大的RNA蛋白质复合体)。

  进入新千年,更多的技术细节被加入到蛋白质解析研究领域。2001年,Roger Kornberg和同事们描述了第一个高精度的RNA聚合酶三维结构,正因此五年后他们共享了诺贝尔化学奖。2007年,首个G蛋白偶联受体结构的解析更是对药物研究带了新的希望。近些年来,越来越多的大的蛋白质结构得到解析。Cryo-EM超低温电子显微镜成像用于超大蛋白质结构成像的研究日益成熟,并开始广泛用于蛋白质结构的解析。

  蛋白质结构解析的常用实验方法

  1.X-ray衍射晶体学成像

  X射线衍射晶体学是最早用于结构解析的实验方法之一。X射线是一种高能短波长的电磁波(本质上属于光子束),被德国科学家伦琴发现,故又被称为伦琴射线。理论和实验都证明了,当X射线打击在分子晶体颗粒上的时候,X射线会发生衍射效应,通过探测器收集这些衍射信号,可以了解晶体中电子密度的分布,再据此析获得粒子的位置信息。利用这种特点,布拉格父子研制出了X射线分光计并测定了一些盐晶体的结构和金刚石结构。首个DNA结构的解析便是利用X射线衍射晶体学获得的。

  后来,获得X射线来源的技术得到了改进,如今更多地使用同步辐射的X射线源。来自同步辐射的X射线源可以调节射线的波长和很高的亮度,结合多波长反常散射技术,可以获得更高精度的晶体结构数据,也成为了当今主流的X射线晶体成像学方法。由X射线衍射晶体学解析的结构在RCSB Protein Data Bank中占到了88%。

  X射线衍射成像虽然得到了长足的发展,仍然有着一定的缺点。X射线对晶体样本有着很大的损伤,因此常用低温液氮环境来保护生物大分子晶体,但是这种情况下的晶体周围环境非常恶劣,可能会对晶体产生不良影响。而且,X射线衍射方法不能用来解析较大的蛋白质。

  2.NMR核磁共振成像

  核磁共振成像NMR全称Nuclear magnetic resonance,最早在1938被Isidor Rabi (1946年诺贝尔奖)描述,在上世纪的后半叶得到了长足发展。其基本理论是,带有孤对电子的原子核(自选量子数为1)在外界磁场影响下,会导致原子核的能级发生塞曼分裂,吸收并释放电磁辐射,即产生共振频谱。这种共振电磁辐射的频率与所处磁场强度成一定比例。利用这种特性,通过分析特定原子释放的电磁辐射结合外加磁场分别,可以用于生物大分子的成像或者其他领域的成像。有些时候,NMR也可以结合其他的实验方法,比如液相色谱或者质谱等。

  RCSB Protein Data Bank数据库中存在大约11000个用NMR解析的生物大分子结构,占到总数大约10%的结构。NMR结构解析多是在溶液状态下的蛋白质结构,一般认为比起晶体结构能够描述生物大分子在细胞内真实结构。而且,NMR结构解析能够获得氢原子的结构位置。然而,NMR也并非万能,有时候也会因为蛋白质在溶液中结构不稳定能难得获取稳定的信号,因此,往往借助计算机建模或者其他方法完善结构解析流程。

蛋白质结构解析六十年

  使用NMR解析的血红蛋白结构建模(图片来源RCSB PDB)

  3.Cryo-EM超低温电子显微镜成像

  电子显微镜最早出现在1931年,从设计之初就是为了试图获得高分辨率的病毒图像。通过电子束打击样本获得电子的反射而获取样本的图像。而图像的分辨率与电子束的速度和入射角度相关。通过加速的电子束照射特殊处理过的样品表明,电子束反射,并被探测器接收,并成像从而获得图像信息。具体做法是,将样品迅速至于超低温(液氮环境)下并固定在很薄的乙烷(或者水中),并置于样品池,在电子显微镜下成像。图像获得后,通过分析图像中数量众多的同一种蛋白质在不同角度的形状,进行多次的计算机建模从而可以获得近原子级别的精度(最低可以到2.0埃)。

蛋白质结构解析六十年

  Cyro-EM解析TRPV1离子通道蛋白(图片来源Structure of the TRPV1 ion channel )

  将电子显微镜和计算机建模成像结合在一起的大量实践还是在新世纪之后开始流行的。随着捕捉电子的探测器技术(CCD技术,以及后来的高精度电子捕捉、电子计数electron counting设备)的提升,更多的信息和更低的噪音保证了高分辨率的图像。

  近些年来,Cryo-EM被用来解析很多结构非常大(无法用X-ray解析)的蛋白质(或者蛋白质复合体),取得了非常好的结果。同时,单电子捕捉技术取代之前的光电转换成像的CCD摄像设备,减少了图像中的噪音和信号衰减,同时并增强了信号。计算机成像技术的成熟和进步,也赋予了Cryo-EM更多的进步空间。然而,Cyro-EM与X-ray不同,该方法不需要蛋白质成为晶体,相同的是都需要低温环境来减少粒子束对样品的损害。

  除去介绍的这三种方法以外,计算机建模技术也越来越多地被用在了蛋白质结构解析中。而且新解析的结构也会提高计算机建模的精确度。未来,我们或许能够用计算机构建原子级别的细胞模型,构建在芯片上的细胞。

  蛋白质结构对了解生命体的生化反应、有针对性的药物研发有着重要意义。从1958到如今已经接近60年,蛋白质结构解析得到了较快的发展。然而,在如今DNA测序如此高效廉价的时代,蛋白质和DNA结构解析并没有进入真正高速发展阶段,这也导致了在如此多的DNA序列数据非常的今天,结构数据却相对少的可怜。大数据时代的基因组、蛋白质组、代谢组、脂类组等飞速发展的时候,蛋白质结构组也得到了更加广泛的重视。发展高精度、高效的结构解析技术也一直都有着重要意义。未来,蛋白质结构解析,对针对蛋白质的药物筛选,和计算机辅助的药物研究研究不应被低估。未来说不定在蛋白质结构领域有着更多惊喜,我们拭目以待。