Nature 报道人类首次全基因组合成仅含 61 种密码子的大肠杆菌,这项研究具有怎样的意义?

@孟凡康 邀~

其实孟小哥哥的回答对这项研究的解读已经很清晰了!!!

不过小编还是将咱BioArt的御用笔杆子之一:立里大佬 的解读给搬运过来。从一个比较正经的学术角度来看,这项研究又是怎么的一个存在,希望可以为大家的进一步理解提供多一些不同角度的看点。


蛋白质编码通用64种三联体密码子,包括3个终止密码子和61个编码20种标准氨基酸的密码子。而通过遗传操作将具有特殊物理和化学性质的非标准氨基酸插入到蛋白质中在蛋白质研究,操控和进化改造领域具有广泛的应用前景【1】。目前,非标准氨基酸的插入大多依赖于琥珀抑制(amber suppression)和生物正交反应(Bioorthogonal reaction)技术。琥珀抑制是指密码子发生琥珀突变产生UAG终止密码子时,琥珀抑制tRNA将UAG改读为某种氨基酸,使被中止的肽链得以继续合成【2】。生物正交反应保证了氨酰tRNA合成酶识别非标准氨基酸和琥珀抑制tRNA的特异性【3】,从而在引入琥珀密码子的目的氨基酸处特异地插入非标准氨基酸。但是正交的氨酰tRNA合成酶和tRNACUA组合具有显著地物种特异性【4】,并且琥珀密码子识别需要和体内的释放因子1(RF1)竞争,这都会降低插入非标准氨基酸的蛋白的产量和纯度。为解决这一问题,研究者定点突变了大肠杆菌321个琥珀终止密码子,从而可缺失必需蛋白RF1,构建了可再编码琥珀密码子的菌株。但定点突变的技术同时也引入许多了非靶标的突变【5】

另一方面, 20种标准氨基酸中的18种存在同义密码子(指同一种氨基酸有两个或更多密码子)编码。同义密码子压缩(synonymous codon compression),指将整个基因组范围内的同义密码子替换为同一个密码子,也能产生可再编码的密码子。而同义密码子的数量远超过终止密码子,并且同义密码子的改变还会影响mRNA的折叠,蛋白的表达和共翻译蛋白折叠【6-8】,因此,同义密码子压缩难度更大。目前,只有研究报道大肠杆菌中包含许多必需基因和目标密码子20 kb基因组已可被同义密码子替换【9】,但这一技术能否在整个基因组范围使用仍旧未知。

2019年5月16日,来自英国剑桥大学医学研究委员会分子生物学实验室的Jason W. Chin团队在Nature发表题为Total synthesis of Escherichia coli with a recoded genome的文章,介绍了该团队人工合成并替换了全部的4Mb大肠杆菌基因组,并将其中丝氨酸的密码子TCG和TCA替换为同义密码子AGC、AGT,琥珀密码子TAG替换为TAA,成功构建一株只有61个密码子的大肠杆菌

作者首先设计了开放阅读框(open reading frame, ORF)内基因序列TCG,TCA,TAG替换为AGC,AGT和TAA的基因组序列。但部分密码子出现在两个ORF的重叠区域。当重叠区域所属的ORF方向相反时,作者将重叠区复制成两份,分别连接到两个ORF的3’端;当所属ORF的方向相同时,将重叠区域复制并在之间插入重叠区域上游20bp的序列(图1)。最终,作者设计了3,978,937 bp的大肠杆菌基因组序列。

为把大肠杆菌基因组替换为设计的基因组序列,作者将设计的基因组分成8个sections,每个section约0.5 Mb;再将每个section划分为4-5个fragments,得到37个fragments。划分的位置尽量避开必需基因。每个fragment在进一步分成9-14个stretch,每个stretch长度在10 kb左右。在酵母中利用同源重组的方法将stretch连接成fragment,并组装成细菌人工染色体。片段两侧连接正负筛选的标记和同源臂,利用之前已建立的REXER4技术将fragment重组替换大肠杆菌基因组对应的部分(图2A)。迭代使用REXER4技术,将4-5个fragment替换到基因组中,形成完整的section(图2B)。最终得到不同Section替代的7株大肠杆菌(section A和B在同一株大肠杆菌中)。

接着,作者对构建的section进行测序,验证同义密码子是否完全被替换。结果发现仍有一些丝氨酸密码子未被替换,包括必需基因map(methionine amino peptidase)的第四个密码子,必需基因ftsI和murE的重叠区域和yceQ和yaaY的编码区基因。作者针对性地优化了这几处密码子设计方案,最终在基因组范围内将全部的UCG,UCA,UAG替换为同义密码子。

为将section整合成为完整的基因组,作者使用细菌接合的方法,将含有origin of transfer (oriT)的供体section接合到受体section下游区域,并使用筛选标记进行筛选,得到成功结合的菌株(图3A)。反复使用细菌接合,最终获得全部1.8万个靶标密码子全部替换的人工合成的大肠杆菌(图3B)。作者将其命名为Syn61。合成过程一共引入8个非预期突变,但都不影响重编码。

最后,作者检测了Syn61的部分性状,发现在LB培养基中其倍增时间为源菌株MDS42的1.6倍,镜下观察长度略长于MDS42,而定量蛋白组检测并没有明显差异。在Syn61中可以缺失编码tRNASerUGA的serT,编码tRNASerCGA的serU和编码RF1的prfA这三个必需基因表明同义密码子被成功压缩(图4)

综上,作者成功通过全基因组合成,构建了一株只有61个密码子的大肠杆菌,从而为重编码多种非标准氨基酸奠定了基础

目前,重编码非标准氨基酸技术已被用于科学研究,诸如蛋白荧光呈像、蛋白功能控制、转录后修饰和医学治疗等领域【1】。通过非标准氨基酸的掺入,蛋白质能够被多种标记探针修饰,例如用于研究电子传递的氧化还原探针,适用于核磁共振分析的同位素探针和适用于X射线衍射的重原子标记探针等。此外,非标准氨基酸侧链标记芳基叠氮,苯甲酮或双吖丙啶可在光诱导下发生交联反应,从而检测到免疫沉淀可能检测不到的体内蛋白相互作用。并且,交联氨基酸能被特异地化学断裂,从而简化质谱分析过程。

1)传统的荧光标记方法使用荧光蛋白与目的蛋白融合,但这种方法可能破坏蛋白结构。而蛋白合成时掺入光稳定的荧光氨基酸则更具优势。小的荧光氨基酸插入到蛋白质中并不会影响蛋白的结构,并且激发光的波长更低,方便用于体外标记。

2)重编码非标准氨基酸也可用于体内控制蛋白功能。通过特异地掺入侧链携带封闭基团的非标准氨基酸到蛋白的关键位点,可以封闭蛋白在体内的功能。使用光或小分子刺激物移除封闭部分,则实现蛋白功能的可控。这种方法在光控蛋白领域具有很大的意义。光控特定激酶和原癌基因的活性,实现对细胞功能的调控。并且,双光子激活策略有利于激活深层组织的蛋白功能。

3)重编码非标准氨基酸方便了蛋白翻译后修饰的功能研究,它可以在蛋白质特定位点插入被修饰的氨基酸,从而不需要鉴定修饰酶并解决体外修饰位点不特异的问题,方便研究翻译后修饰对蛋白结构和功能的影响。

4)重编码非标准氨基酸也被用于优化多种治疗策略。非标准氨基酸修饰的细胞因子,生长因子和抗体能延长半衰期并增强治疗效果。将CD3抗体标记上能特异结合肿瘤表面抗原的小分子,从而可以帮助细胞毒性T细胞识别癌细胞,这已在前列腺癌移植性小鼠模型上发挥良好的治疗作用。此外,将琥珀密码子掺入丁型肝炎病毒,HIV或甲型流感病毒的基因组中,使病毒只能在琥珀抑制的宿主中进行复制,从而改造后的病毒有潜力成为新型疫苗。将细菌改造为生长严格依赖于非标准氨基酸可有效防止生物泄露,从而在生物安全控制方面具有很大潜力。

5)插入新的非标准氨基酸也会增强酶的反应能力。掺入非标准氨基酸的β内酰胺酶已被报道具有更高的催化活性,X射线晶体衍射分析证明掺入的非标准氨基酸稳定了参与反应限速步骤酶的活性中心构象。

本文中作者构建了只使用61种密码子的大肠菌,将能在蛋白质中掺入更多种非天然氨基酸,甚至合成非标准氨基酸高聚物,因此具有更大的应用潜力。

本文的通讯作者是来自英国剑桥大学的Jason W. chin研究员,实验室致力于遗传密码重编程研究,率先开发和应用重编程生物体遗传密码的方法。文章第一作者为实验室成员Julius Fredens,Kaihang Wang,Daniel de la Torre,Louise F. H. Funke,Wesley E. Robertson。

原文链接:

https://doi.org/10.1038/s41586-019-1192-5

参考文献

1.Chin JW. Expanding and reprogramming the genetic code [J]. Nature, 2017. 550(7674): 53-60

2.Eggertsson G,Soll D. Transfer ribonucleic acid-mediated suppression of termination codons in Escherichia coli [J]. Microbiol Rev, 1988. 52(3): 354-374

3.Sletten EM,Bertozzi CR. Bioorthogonal chemistry: fishing for selectivity in a sea of functionality [J]. Angew Chem Int Ed Engl, 2009. 48(38): 6974-6998

4.Wang L, Brock A, Herberich B, et al. Expanding the genetic code of Escherichia coli [J]. Science, 2001. 292(5516): 498-500

5.Lajoie MJ, Rovner AJ, Goodman DB, et al. Genomically recoded organisms expand biological functions [J]. Science, 2013. 342(6156): 357-360

6.Kudla G, Murray AW, Tollervey D, et al. Coding-sequence determinants of gene expression in Escherichia coli J. Science, 2009. 324(5924): 255-258

http://7.Li GW, Oh E,Weissman JS. The anti-Shine-Dalgarno sequence drives translational pausing and codon choice in bacteria [J]. Nature, 2012. 484(7395): 538-541

8.Zhang G, Hubalewska M,Ignatova Z. Transient ribosomal attenuation coordinates protein synthesis and co-translational folding [J]. Nat Struct Mol Biol, 2009. 16(3): 274-280

9.Wang K, Fredens J, Brunner SF, et al. Defining synonymous codon compression schemes by genome recoding [J]. Nature, 2016. 539(7627): 59-64

来源:知乎 www.zhihu.com

作者:BioArtReports

【知乎日报】千万用户的选择,做朋友圈里的新鲜事分享大牛。
点击下载

此问题还有 8 个回答,查看全部。
延伸阅读:
小提质粒后,测序结果显示目的基因后多了两个碱基(GC)是为什么?

能否将细菌防御机制(CRISPR)使用在真核细胞(例如T细胞?)?