生物体内的细胞是如何判断应该表达什么基因的?

细胞如何判断应该表达什么基因?细胞没有思维,没法跟人一样先做决定然后执行,对细胞而言,决定和执行是同时发生的。下面我主要分享一下细胞如何表达一些特定的基因,而不表达另一些基因的,即基因的选择性表达。

人类细胞有2万多个蛋白编码基因,4万多个非编码RNA基因[1]。如果细胞有思维的话,细胞如何选择表达哪些基因确实是个非常头痛的问题。一个基本的原则是:按需表达。人类细胞经过亿万年的进化,细胞采取最经济的方式来维持正常功能。

管家基因:表达一时爽,一直表达一直爽

基因可简单分为管家基因(housekeeping gene)和非管家基因。管家基因,顾名思义,就像是细胞的管家,在所有类型的细胞中,无论正常还是疾病状态下,都持续稳定表达。因此,至少这部分基因,细胞不需要思考,一直表达就OK啦。

管家基因编码的蛋白是构成细胞的物质基础。常见的管家基因有微管蛋白(tubulin),是细胞内微管的核心组分;肌动蛋白(actin),是细胞骨架的重要组分;甘油醛3-磷酸脱氢酶(GAPDH),参与细胞的糖酵解。

那么,人类基因组中到底有多少管家基因呢?研究者对16种正常人类组织中的基因表达进行分析。根据定义,管家基因需要在所有的组织/细胞中表达基本一致,研究者一共鉴定了3804个管家基因[2]。

人类管家基因的列表详见:https://www.tau.ac.il/~elieis/HKG/

基因的多维度表达调控

对人类而言,除了生殖细胞,所有细胞含有的遗传信息基本相同,但呈现在我们眼前的并不是一团细胞,而是一个个鲜活的会思辨的生命。因此,人类本身就是细胞基因选择性表达的最好诠释。对于不同的个体,基因型存在一定差异,但还有一种特殊的情况——同卵双胞胎,基因完全相同,但双胞胎最后会呈现出很多差异,比如双胞胎的性格往往迥异。同卵双胞胎也是基因选择性表达的一个绝佳案例。

那么,为何基因会选择性表达呢?要搞清楚这个问题,首先得明白基因表达的基本流程。根据经典的中心法则,DNA转录得到RNA,RNA翻译得到执行多重生命功能的蛋白质。看起来非常清晰,只要存在DNA,经过中心法则,就能源源不断得到蛋白。但这样是不合理的,细胞并不需要表达所有的基因,只需要在特定的情况下表达特定组合的基因。回答基因在何时何地以何种方式表达,这是“表观遗传学”的研究范畴,也正是我的研究方向。

基因的选择性表达归因于基因的表达调控。基因表达调控可分为多个维度,包括染色体层面的基因组3D结构,DNA层面的化学修饰,RNA层面的RNA加工,包括可变剪接、RNA修饰、非编码RNA调控等,以及蛋白质层面的蛋白质修饰。

染色质层面——染色体高级结构可调控基因表达

真核生物的染色体并不是线性存在于细胞核的。实际上,对人类细胞而言,染色体总长度超过2米,而细胞核尺寸为微米级别,如何将2米长的染色体塞进微米级的细胞核,而且还能执行极其复杂的生物学功能呢?答案是极其复杂的折叠。

既然是染色质折叠,会出现折叠紧密的地方和相对松散的地方。折叠紧密的地方,DNA转录相关的蛋白无法靠近,基因无法表达;而折叠松散的地方,基因表达活性相对更高。因此,染色质结构对基因表达进行了选择。

3D基因组调控基因表达是目前最前沿的研究领域,但是由于这个过程实在太复杂,以及研究的策略和方法并不多,具体的调控机制并不十分清楚。

DNA层面——DNA和组蛋白修饰调控基因表达

很早人们就发现了DNA上可以发生化学修饰,化学修饰主要为胞嘧啶5位上的甲基化,而DNA甲基化可以调控基因的表达。基因的表达需要启动子(转录起始位点附近的一段特殊的DNA序列),启动子区域如果出现DNA甲基化,基因通常沉默;如果没有甲基化,基因通常表达。正如在很多肿瘤细胞中,抑癌基因的启动子区域被甲基化,抑癌基因沉默,促进了癌症的发生。

DNA甲基化调控基因表达其实也是非常复杂。DNA甲基化出现在不同区域,比如基因体,反而是基因活性表达的标志。我们实验室今年发表的文章,揭示了更为复杂的DNA甲基化调控基因表达的新范式[4]。

正如刚才提到的,DNA并不是线性地存在于细胞核中,是高度折叠的。具体的情况是,DNA缠绕在组蛋白上,形成染色体的基本单位核小体。从物理空间上,组蛋白与DNA紧密结合,因此组蛋白的理化性质也可以影响DNA的特性。目前已经发现很多种组蛋白修饰可以调控基因的表达。

组蛋白修饰可通过影响染色体的结构,比如让染色质变得紧缩或者松散,调控基因表达。

RNA层面——可变剪接、RNA修饰、非编码RNA调控

RNA层面的调控更加复杂,包括可变剪接、RNA修饰、非编码RNA调控。很多基因哪怕能顺利转录出RNA,但也不一定能翻译出蛋白;或者经过进一步加工,得到不同形式的转录本,最终翻译出不同的蛋白质。

(1)可变剪接

对于有多个外显子的基因而言,同一个基因可能对应多种不同的转录本,而不同转录本的形成依赖于可变剪接,即采用不同的形式,剪切掉不同的内含子,然后把外显子拼接起来的过程。

如果对于细胞A,你看到的蛋白1的表达;对于细胞B,你看到了蛋白2的表达。蛋白1和蛋白2来源于同一个基因,而可变剪接使得不同细胞表达出不同的形式,这也是基因选择性表达的范例。

(2)RNA修饰

类似于DNA,RNA上也可以发生多种修饰。mRNA上的修饰可影响其稳定性,促进或抑制该mRNA的翻译,即RNA修饰也可以调控基因的表达。RNA修饰是生物医学研究的前沿,有很多金矿有待挖掘。

(3)非编码RNA调控

非编码RNA自己虽然不能翻译为蛋白,但是有决定谁能翻译为蛋白的能力呀!具有调控功能的非编码RNA包括miRNA、siRNA等。

miRNA大约19~22nt,人小鬼大,在细胞浆内靶向mRNA 3’UTR,促进mRNA的降解或者阻断翻译过程,从而抑制这个基因的表达。当然,凡事都有两面性。我们lab的研究发现,miRNA也能出现在细胞核中,通过靶向增强子(类似启动子的具有调控功能的特殊序列),增强基因的表达[6]。siRNA是small interfering RNA,即小非干扰RNA,类似地,也能降解mRNA。

蛋白层面——蛋白修饰

翻译出来的蛋白质本身也可以发生很多修饰,最常见的是磷酸化、泛素化等,这些修饰也可以影响蛋白的活性。

总体而言,把基因比作电灯,这个电灯有很多开关,开关的排列组合,最终决定了基因表达的选择性。

参考文献:

1. Salzberg, S.L., Open questions: How many genes do we have? BMC Biol, 2018. 16(1): p. 94.

2. Eisenberg, E. and E.Y. Levanon, Human housekeeping genes, revisited. Trends Genet, 2013. 29(10): p. 569-74.

3. Caridi, C.P., et al., Nuclear actin filaments in DNA repair dynamics. Nature Cell Biology, 2019. 21(9): p. 1068-1077.

4. Li, J., et al., Guide Positioning Sequencing identifies aberrant DNA methylation patterns that alter cell identity and tumor-immune surveillance networks. Genome Res, 2019. 29(2): p. 270-280.

5. Lam, J.K.W., et al., siRNA Versus miRNA as Therapeutics for Gene Silencing. Molecular Therapy – Nucleic Acids, 2015. 4: p. e252.

6. Xiao, M., et al., MicroRNAs activate gene transcription epigenetically as an enhancer trigger. RNA Biol, 2017. 14(10): p. 1326-1334.

来源:知乎 www.zhihu.com

作者:xupenggoing

【知乎日报】千万用户的选择,做朋友圈里的新鲜事分享大牛。
点击下载

此问题还有 4 个回答,查看全部。
延伸阅读:
体细胞内有没有基因不同的细胞?

人体中的全部基因只有2到3万个,而细胞数量却有40多万亿,那每个细胞都包含基因吗?