Science:RNA的美丽新世界
[2014/6/16]
至少对于某些理论学家来说,生命的最初形式就是RNA。生命可能源自自我复制的RNA分子,而分子生物学家却长期将目光放在DNA上。但这一偏见确实有不错的理由。DNA不仅被广泛认为携带着生命指令的决定性拷贝,而且也更易于在实验室操作。
如今,这两个合理解释都土崩瓦解了。基于非蛋白编码部分RNA的一整层基因调控模式的发现,以及同期发展起来、操作这些分子的新工具和新技术,已经激起了人们对理解和探索RNA世界的浓厚兴趣。在过去的几年间,这一领域的创新包括了从解决简单问题如制备今后分析所需的RNA保存制剂,到开拓全新的前沿如对单细胞中所有RNA转录本进行测序的方法。这种方法单刀直入,一些研究者甚至开始用它来代替转录本分析的芯片法。同时,为了提高可靠性,有些已经成型的技术也已得到彻底的革新,如利用小片段干扰RNA(short interfering RNA,siRNA)来进行基因沉默的技术。
解码信息
研究RNA的基础性进展始于2008年,当时研究者描绘的技术是测定一群细胞中的全部转录本。这种RNA-Seq的测序方法需要对纯化过的信使RNA进行反转录,然后利用下一代测序工具来测定所有产生的cDNA。结果是细胞转录组的完全序列。
整个转录组的测序非常强大,然而最初版本的RNA-Seq也存在着一些限制。“2009年,我们最初的RNA-Seq试剂盒需要至少一微克的RNA,而且需要高质量的(RNA),否则你无法得到好结果。”位于加利福尼亚州圣地亚哥市Illumina的杰出科学家Gary Schroth表示。
Illumina自此开始精炼步骤,现在提供的RNA测序试剂盒已可以使用少至100纳克的RNA,这样就使研究人员能够测定小块组织样本中的转录组。该公司也提供去除核糖体RNA的试剂,核糖体RNA是困扰第一代RNA-Seq技术的主要污染物之一。
在一项被称为Smart-Seq的技术演化中,研究者甚至可以设法测出单个细胞中的转录组。“如果在若干年前,一说到能够做单细胞(RNA测序),这种想法我会说‘不可能’,但当你有一个分离的、自由悬浮的细胞时,会发现实际上达到这种水平也并非难事。”Schroth说。Smart-Seq对于粗杂的组织制备没有作用,因此RNA-Seq仍然是研究这些样品的最好方法。
随着转录组测序持续发展,测序成本持续下降,很多生物学家现在开始使用RNA-Seq技术来进行常规转录组分析,这一工作以前留给RNA分析芯片来完成。芯片通过将RNA与短寡聚核苷酸组成的微阵列进行杂交,来确定存在哪些转录本。尽管这一方法多年来一直是转录组分析的主力军,它却只能够鉴定出芯片制造者预测到的细胞可产生的RNA序列。由于 RNA-Seq技术的非偏倚性,它常常会显示出可变剪切的RNA形式和全新的转录本,而这些在芯片中却无法显示,研究者可以就此对数据进行深入挖掘。 Schroth所在的公司可以制造这两种分析类型的仪器,他声称,芯片在一些涉及大量样本的研究中仍然具有优势。
不管生物学家使用的转录分析策略如何,他们敏锐地意识到转录并不能确保一个基因产物的表达。尤其是RNA干扰(RNA interference,RNAi)系统产生的大量短的RNA片段能够结合表达的转录本,并且靶向进行破坏。研究人员最初想通过对细胞中短片段RNA群体进行测序,并对不同序列的相对丰度进行定量,进而研究这一系统。这证明是比较棘手的。
“我们通过一些体外实验发现,一些小RNA的细胞群体在测序文库的呈现并没有其他的好。”位于马萨诸塞州伊普斯维奇的新英格兰生物实验室的资深科学家Brett Robb说。尤其是许多动物和植物细胞修饰了它们小RNA的3’末端,这样,标准的测序方法将不足以展现出这些修饰过的分子。为了解决这一问题,Robb 和他的同事优化了一种基于连接反应的技术,该技术能在测序前将一个特定修饰过的DNA接头连接到小RNA上。
当科学家继续深入研究转录后基因调控时,他们发现了额外的RNA类型。Robb说:“在我们研究小RNA时,很多我们了解到的事情都将对一些新兴事物有所助益,例如最近非常火的长非编码RNA( long noncoding RNAs,lncRNAs)。”
lncRNAs是超过200个核苷酸的RNA片段,它们不编码蛋白质,但反倒以多种方式调控转录和翻译。在大规模的测序计划中,科学家估计人类基因组至少编码数以万计的lncRNAs,意味着这些分子代表了基因调控的另一主要层次。
lncRNAs是双链的,可由基因组DNA的任意一条链进行编码。这为早期的lncRNA研究者带来了主要问题,他们经常难以找出某个lncRNA来源于哪条DNA链。现在,NEB公司为此开发了一个名为NEBNext Ultra的试剂盒,生产链特异性的测序文库。
沉默的片刻
除了测序并研究非编码RNA之外,研究人员也在将其用于探究基因的功能。利用合成siRNA寡核苷酸瞬时阻断目标蛋白的表达已成为标准的实验室技术,药物研发人员也开始继续探索使用RNA干扰机制治疗疾病的方式。
的确,基于RNA干扰的治疗法与许多生物制药产业所采用的技术遵循着同样的循环。“当人们发现RNA干扰时,当然是十分兴奋的,而后又会经历跌宕起伏,然后RNA干扰又兴起了。”位于加利福尼亚州卡尔斯巴德的生命技术公司RNA干扰技术部高级产品经理Nitin Puri说。
最初能够瞬时关闭任何基因表达的希望很快就被现实取代了,研究人员发现他们的合成siRNA分子常常靶向多个转录本,并且往往缺乏传统药物的效力。在最初的失望之后,该领域又开始逐渐恢复,研究人员开始解决其中的一些问题。“在过去的两到三年间,我们看到研究者已经(对siRNA)更有兴趣,因为他们意识到该技术如何帮助他们真正洞察并理解高通量筛选。”Puri说。
人们开始使用改进的寡核苷酸设计算法和化学标记,例如,生命技术公司现在能够合成应对单个或多个基因的有效、特定siRNA。通过用这些新的siRNA进行高通量筛选,科学家可以快速缩小可能与特定表型相关的基因列表。
但即便是很好的高通量筛选还是会产生大量的误差,通常会标记出许多与研究者研究表型不直接相关的基因。筛选数据的新策略可能会有所帮助。“我们与研发新方法的研究者合作,特别是生物信息学方法,来清除不必要的基因。”Puri说。
研究人员也学会了让自己对siRNA的期望更加现实 。“那些使用RNA干扰并且在这一领域研究多年的科学家开始理解,并更加接受它的天然缺陷。”位于马萨诸塞州沃尔瑟姆的赛默飞世尔公司高级产品经理Louise Baskin说,“机制本身就很混乱,我们尽力让它变得更具体,但经常还是会有不可预料的事情发生。”
即使一些针对重要基因产物的高特异性siRNA分子也无法产生表型,但生物学家早已清楚知道其中的原因。“逐个攻破基因的困扰之一在于我们的细胞非常聪明,它们具有次生通路和冗余的机制来拯救自己。”Baskin说。为了最大化siRNA筛选成功的几率,她建议使用针对一个通路中多个基因靶点的一套siRNA,而非只用一个。赛默飞世尔公司提供预制的siRNA文库来支持这一策略,这些文库能够靶向人类、大鼠或者小鼠中的任何已知基因,而且这家公司近期也新增了针对长非编码RNA的siRNA文库。
对于想要在原生细胞或整个组织中进行操作的研究者来说,仅仅让siRNA分子接近靶标也会产生麻烦,因为这些细胞通常会抵抗传统的转化方法。为了解决这一问题,赛默飞世尔公司研发了一套自我递送的siRNA系,携带的化学修饰会允许它们直接进入细胞。
快速敲除
合成的siRNA为瞬时调低基因表达提供了便捷的方式,而要找寻持久影响的研究人员则往往会转向那些编码短发卡RNA(short hairpin RNAs,shRNA)的DNA载体。转化或转染了这些载体之一的细胞在细胞核中转录了短发卡RNA,并在其中通过自身的RNA干扰机制去形成应对特异性转录本的siRNA。载体在细胞中持续存在,从而就能永久地沉默目标基因产物。
通过将靶向不同转录本的一组 shRNA混在一起,研究者能够产出一群细胞,其中每个细胞都有一个不同基因被沉默。通过分离展现出所需表型的细胞,并对它们携带的载体进行测序,就能提供出可能参与到那个表型的快捷基因图谱。这种混合池的方法极大地降低了高通量shRNA筛选的成本和复杂性。“不同于将一个shRNA放入一个细胞孔中观测结果,你可以将许多甚至上千个shRNA一次性放入整板的细胞中,如果你的实验计划和执行够仔细…你将能在更低的成本和更快的速度下迅速筛选出大量的基因。”位于密苏里州圣路易斯市的西格玛生命科学公司功能基因组细分市场经理Shawn Shafer说。
为了助力分析工作,布罗德研究所RNA干扰共同体的科学家已经制出了靶向15000个人类和15000个小鼠基因的shRNA文库。这些shRNA被打包在能够转染大量细胞的慢病毒基因载体中。目前,西格玛公司和赛默飞世尔公司都为研究者提供这样的文库。现在,这一共同体正试着研制至少两个高效、经过验证的基于 RNA干扰抑制子,不仅针对每个人类和小鼠的基因,而且也针对长非编码RNA。这些试剂将会让高通量遗传筛选更加容易。
随着方法的提升,研究人员也开始揭开新的难题。近期关于RNA干扰机制的数据显示,一个仅有7个核苷酸长度的小“种子序列”可能决定着小RNA的特异性。这将有助于解释许多siRNA和shRNA抑制子含混不清的效应;一个七碱基的序列与22碱基序列相比,能够潜在结合更多的转录本。“他们目前所做的混合池筛选需要两个或三个对应同一转录本的shRNA作为采样数,某种程度上可以充当最初采样的重新验证。”Shafer说。
西格玛公司也提供采用siRNA实验相同方法的试剂盒。在该公司的EasyRNA方案中,实验者可以扩增转录本的片段,并将它变成覆盖整个片段的siRNA混合池。以定制的多重siRNA去靶向转录本可能会有助于在最小化脱靶影响的同时使沉默最大化。
为长期基因沉默设计高效的shRNA是一项更为艰巨的任务。最初,生物学家仅仅借用了他们用来设计合成siRNA的算法,并将其应用在shRNA载体上。这个效果并不明显。“如果你放入一条(siRNA)序列,并试着在一个载体中表达它,你将在功能上得到大量的变异性。”位于阿拉巴马州亨茨维尔的 TransOMIC公司高级产品经理Andy Crouse说。
同一序列在siRNA和shRNA间的性能差异可能来源于它们在细胞中差异颇大的通路。Crouse解释道,当shRNA被转录并进入与自身RNA干扰系统相同的细胞机制时,合成的siRNA绕过了这一途径的大部分,并直接与它们的靶标转录本相结合。
一段时间以来,围绕这一问题,科学家简单地通过使用多重shRNA载体针对每个想要沉默的转录本,希望其中一个或者组合起来能够达到较好的效果。做混合池shRNA筛选的能力最终帮助研究者从一个大的分组中分离大部分有效的shRNA。分析有效的shRNA混池带来了新的算法,能够准确地预测沉默给定靶标最恰当的shRNA序列。TransOMIC公司现在使用这一算法设计shRNA的定制套系,同时也预建了靶向特定基因家族的shRNA文库。
随着非编码RNA的研究技术不断发展,该领域的专家也看到了RNA世界的美好未来。“人类的复杂性并不能通过我们比例较小的蛋白编码基因来解释……我们所拥有的复杂性存在于我们基因组中会转录为RNA、但永远也不会产生蛋白的那部分比例中。”赛默飞世尔公司的Baskin说。她补充道:“我们如何进行研究,这对于我们对生物系统的理解意味着什么,这些问题实际上有无尽的可能性。”
如今,这两个合理解释都土崩瓦解了。基于非蛋白编码部分RNA的一整层基因调控模式的发现,以及同期发展起来、操作这些分子的新工具和新技术,已经激起了人们对理解和探索RNA世界的浓厚兴趣。在过去的几年间,这一领域的创新包括了从解决简单问题如制备今后分析所需的RNA保存制剂,到开拓全新的前沿如对单细胞中所有RNA转录本进行测序的方法。这种方法单刀直入,一些研究者甚至开始用它来代替转录本分析的芯片法。同时,为了提高可靠性,有些已经成型的技术也已得到彻底的革新,如利用小片段干扰RNA(short interfering RNA,siRNA)来进行基因沉默的技术。
解码信息
研究RNA的基础性进展始于2008年,当时研究者描绘的技术是测定一群细胞中的全部转录本。这种RNA-Seq的测序方法需要对纯化过的信使RNA进行反转录,然后利用下一代测序工具来测定所有产生的cDNA。结果是细胞转录组的完全序列。
整个转录组的测序非常强大,然而最初版本的RNA-Seq也存在着一些限制。“2009年,我们最初的RNA-Seq试剂盒需要至少一微克的RNA,而且需要高质量的(RNA),否则你无法得到好结果。”位于加利福尼亚州圣地亚哥市Illumina的杰出科学家Gary Schroth表示。
Illumina自此开始精炼步骤,现在提供的RNA测序试剂盒已可以使用少至100纳克的RNA,这样就使研究人员能够测定小块组织样本中的转录组。该公司也提供去除核糖体RNA的试剂,核糖体RNA是困扰第一代RNA-Seq技术的主要污染物之一。
在一项被称为Smart-Seq的技术演化中,研究者甚至可以设法测出单个细胞中的转录组。“如果在若干年前,一说到能够做单细胞(RNA测序),这种想法我会说‘不可能’,但当你有一个分离的、自由悬浮的细胞时,会发现实际上达到这种水平也并非难事。”Schroth说。Smart-Seq对于粗杂的组织制备没有作用,因此RNA-Seq仍然是研究这些样品的最好方法。
随着转录组测序持续发展,测序成本持续下降,很多生物学家现在开始使用RNA-Seq技术来进行常规转录组分析,这一工作以前留给RNA分析芯片来完成。芯片通过将RNA与短寡聚核苷酸组成的微阵列进行杂交,来确定存在哪些转录本。尽管这一方法多年来一直是转录组分析的主力军,它却只能够鉴定出芯片制造者预测到的细胞可产生的RNA序列。由于 RNA-Seq技术的非偏倚性,它常常会显示出可变剪切的RNA形式和全新的转录本,而这些在芯片中却无法显示,研究者可以就此对数据进行深入挖掘。 Schroth所在的公司可以制造这两种分析类型的仪器,他声称,芯片在一些涉及大量样本的研究中仍然具有优势。
不管生物学家使用的转录分析策略如何,他们敏锐地意识到转录并不能确保一个基因产物的表达。尤其是RNA干扰(RNA interference,RNAi)系统产生的大量短的RNA片段能够结合表达的转录本,并且靶向进行破坏。研究人员最初想通过对细胞中短片段RNA群体进行测序,并对不同序列的相对丰度进行定量,进而研究这一系统。这证明是比较棘手的。
“我们通过一些体外实验发现,一些小RNA的细胞群体在测序文库的呈现并没有其他的好。”位于马萨诸塞州伊普斯维奇的新英格兰生物实验室的资深科学家Brett Robb说。尤其是许多动物和植物细胞修饰了它们小RNA的3’末端,这样,标准的测序方法将不足以展现出这些修饰过的分子。为了解决这一问题,Robb 和他的同事优化了一种基于连接反应的技术,该技术能在测序前将一个特定修饰过的DNA接头连接到小RNA上。
当科学家继续深入研究转录后基因调控时,他们发现了额外的RNA类型。Robb说:“在我们研究小RNA时,很多我们了解到的事情都将对一些新兴事物有所助益,例如最近非常火的长非编码RNA( long noncoding RNAs,lncRNAs)。”
lncRNAs是超过200个核苷酸的RNA片段,它们不编码蛋白质,但反倒以多种方式调控转录和翻译。在大规模的测序计划中,科学家估计人类基因组至少编码数以万计的lncRNAs,意味着这些分子代表了基因调控的另一主要层次。
lncRNAs是双链的,可由基因组DNA的任意一条链进行编码。这为早期的lncRNA研究者带来了主要问题,他们经常难以找出某个lncRNA来源于哪条DNA链。现在,NEB公司为此开发了一个名为NEBNext Ultra的试剂盒,生产链特异性的测序文库。
沉默的片刻
除了测序并研究非编码RNA之外,研究人员也在将其用于探究基因的功能。利用合成siRNA寡核苷酸瞬时阻断目标蛋白的表达已成为标准的实验室技术,药物研发人员也开始继续探索使用RNA干扰机制治疗疾病的方式。
的确,基于RNA干扰的治疗法与许多生物制药产业所采用的技术遵循着同样的循环。“当人们发现RNA干扰时,当然是十分兴奋的,而后又会经历跌宕起伏,然后RNA干扰又兴起了。”位于加利福尼亚州卡尔斯巴德的生命技术公司RNA干扰技术部高级产品经理Nitin Puri说。
最初能够瞬时关闭任何基因表达的希望很快就被现实取代了,研究人员发现他们的合成siRNA分子常常靶向多个转录本,并且往往缺乏传统药物的效力。在最初的失望之后,该领域又开始逐渐恢复,研究人员开始解决其中的一些问题。“在过去的两到三年间,我们看到研究者已经(对siRNA)更有兴趣,因为他们意识到该技术如何帮助他们真正洞察并理解高通量筛选。”Puri说。
人们开始使用改进的寡核苷酸设计算法和化学标记,例如,生命技术公司现在能够合成应对单个或多个基因的有效、特定siRNA。通过用这些新的siRNA进行高通量筛选,科学家可以快速缩小可能与特定表型相关的基因列表。
但即便是很好的高通量筛选还是会产生大量的误差,通常会标记出许多与研究者研究表型不直接相关的基因。筛选数据的新策略可能会有所帮助。“我们与研发新方法的研究者合作,特别是生物信息学方法,来清除不必要的基因。”Puri说。
研究人员也学会了让自己对siRNA的期望更加现实 。“那些使用RNA干扰并且在这一领域研究多年的科学家开始理解,并更加接受它的天然缺陷。”位于马萨诸塞州沃尔瑟姆的赛默飞世尔公司高级产品经理Louise Baskin说,“机制本身就很混乱,我们尽力让它变得更具体,但经常还是会有不可预料的事情发生。”
即使一些针对重要基因产物的高特异性siRNA分子也无法产生表型,但生物学家早已清楚知道其中的原因。“逐个攻破基因的困扰之一在于我们的细胞非常聪明,它们具有次生通路和冗余的机制来拯救自己。”Baskin说。为了最大化siRNA筛选成功的几率,她建议使用针对一个通路中多个基因靶点的一套siRNA,而非只用一个。赛默飞世尔公司提供预制的siRNA文库来支持这一策略,这些文库能够靶向人类、大鼠或者小鼠中的任何已知基因,而且这家公司近期也新增了针对长非编码RNA的siRNA文库。
对于想要在原生细胞或整个组织中进行操作的研究者来说,仅仅让siRNA分子接近靶标也会产生麻烦,因为这些细胞通常会抵抗传统的转化方法。为了解决这一问题,赛默飞世尔公司研发了一套自我递送的siRNA系,携带的化学修饰会允许它们直接进入细胞。
快速敲除
合成的siRNA为瞬时调低基因表达提供了便捷的方式,而要找寻持久影响的研究人员则往往会转向那些编码短发卡RNA(short hairpin RNAs,shRNA)的DNA载体。转化或转染了这些载体之一的细胞在细胞核中转录了短发卡RNA,并在其中通过自身的RNA干扰机制去形成应对特异性转录本的siRNA。载体在细胞中持续存在,从而就能永久地沉默目标基因产物。
通过将靶向不同转录本的一组 shRNA混在一起,研究者能够产出一群细胞,其中每个细胞都有一个不同基因被沉默。通过分离展现出所需表型的细胞,并对它们携带的载体进行测序,就能提供出可能参与到那个表型的快捷基因图谱。这种混合池的方法极大地降低了高通量shRNA筛选的成本和复杂性。“不同于将一个shRNA放入一个细胞孔中观测结果,你可以将许多甚至上千个shRNA一次性放入整板的细胞中,如果你的实验计划和执行够仔细…你将能在更低的成本和更快的速度下迅速筛选出大量的基因。”位于密苏里州圣路易斯市的西格玛生命科学公司功能基因组细分市场经理Shawn Shafer说。
为了助力分析工作,布罗德研究所RNA干扰共同体的科学家已经制出了靶向15000个人类和15000个小鼠基因的shRNA文库。这些shRNA被打包在能够转染大量细胞的慢病毒基因载体中。目前,西格玛公司和赛默飞世尔公司都为研究者提供这样的文库。现在,这一共同体正试着研制至少两个高效、经过验证的基于 RNA干扰抑制子,不仅针对每个人类和小鼠的基因,而且也针对长非编码RNA。这些试剂将会让高通量遗传筛选更加容易。
随着方法的提升,研究人员也开始揭开新的难题。近期关于RNA干扰机制的数据显示,一个仅有7个核苷酸长度的小“种子序列”可能决定着小RNA的特异性。这将有助于解释许多siRNA和shRNA抑制子含混不清的效应;一个七碱基的序列与22碱基序列相比,能够潜在结合更多的转录本。“他们目前所做的混合池筛选需要两个或三个对应同一转录本的shRNA作为采样数,某种程度上可以充当最初采样的重新验证。”Shafer说。
西格玛公司也提供采用siRNA实验相同方法的试剂盒。在该公司的EasyRNA方案中,实验者可以扩增转录本的片段,并将它变成覆盖整个片段的siRNA混合池。以定制的多重siRNA去靶向转录本可能会有助于在最小化脱靶影响的同时使沉默最大化。
为长期基因沉默设计高效的shRNA是一项更为艰巨的任务。最初,生物学家仅仅借用了他们用来设计合成siRNA的算法,并将其应用在shRNA载体上。这个效果并不明显。“如果你放入一条(siRNA)序列,并试着在一个载体中表达它,你将在功能上得到大量的变异性。”位于阿拉巴马州亨茨维尔的 TransOMIC公司高级产品经理Andy Crouse说。
同一序列在siRNA和shRNA间的性能差异可能来源于它们在细胞中差异颇大的通路。Crouse解释道,当shRNA被转录并进入与自身RNA干扰系统相同的细胞机制时,合成的siRNA绕过了这一途径的大部分,并直接与它们的靶标转录本相结合。
一段时间以来,围绕这一问题,科学家简单地通过使用多重shRNA载体针对每个想要沉默的转录本,希望其中一个或者组合起来能够达到较好的效果。做混合池shRNA筛选的能力最终帮助研究者从一个大的分组中分离大部分有效的shRNA。分析有效的shRNA混池带来了新的算法,能够准确地预测沉默给定靶标最恰当的shRNA序列。TransOMIC公司现在使用这一算法设计shRNA的定制套系,同时也预建了靶向特定基因家族的shRNA文库。
随着非编码RNA的研究技术不断发展,该领域的专家也看到了RNA世界的美好未来。“人类的复杂性并不能通过我们比例较小的蛋白编码基因来解释……我们所拥有的复杂性存在于我们基因组中会转录为RNA、但永远也不会产生蛋白的那部分比例中。”赛默飞世尔公司的Baskin说。她补充道:“我们如何进行研究,这对于我们对生物系统的理解意味着什么,这些问题实际上有无尽的可能性。”
下一篇:2014年全球电子诊断市场分析