表达调控
功能效应
对基因组大小和结构的影响
触发基因组大小变异
目前关于基因组大小进化,多数观点认为与基因组扩张(或DNA含量增加) 和删减丢失这两种反方向进化动力的共同作用有关。除了基因组加倍,转座子 (尤其是LTR 逆转座子) 是导致基因组扩张的另一种动力。在植物转座子中,LTR 逆转座子是通过“复制-粘贴”的方式来进行转座的,在寄主基因组中会不断增加自身的拷贝数, 可以在短时期内使得植物基因大小迅速增加。玉米基因组大小(1C = 2,640 Mb) 是高梁的(1C = 818 Mb) 的三倍,这两个近缘物种的基因组大小差异是从共同祖先分化后, LTR 逆转座子在玉米迅速扩张所导致的(SanMiguelet al., 1998)。而且这种扩张是不均一的,主要是发生在基因间隔区,可能是这些区域受到的选择压通常要小(Bruggmannet al., 2006)。
相对于基因组扩张,导致基因组大小减少最直接的动力还不是很明晰。已有研究发现基因组 DNA 删除动力是发生在 LTR 逆转座子内或LTR 逆转座子间的重组 (同上面提到的清除机制)。LTR 逆转座子短时间内在寄主基因组扩张,并不会无限地进行, 重组可以限制它们对寄主基因组的强烈冲击。寄主基因组会通过不等同源重组或不规则重组而丢失一部分基因组 DNA,最终形成孤立 LTRs 或截断LTR 逆转座子。例如在拟南芥基因组中就发现了大量不完整的孤立 LTRs 和截断 LTR 逆转座子(Devoset al., 2002),正是通过这些重组导致拟南芥基因组 DNA 的丢失。随后,在水稻(Vitteet al., 2007)、小麦(Wickeret al., 2001)和大麦(Shirasuet al., 2000)的基因组中也发现了许多结构类似的序列。
导致基因组结构重排
LTR 逆转座子可通过复制和转座能力重新排列基因组。由于插入、缺失或破坏而导致的基因组重排可能产生重大的影响,从产生遗传变异到创造足够的遗传多样性以促进适应性选择(Leeet al., 2015)。逆转座子 Bs1 获得了部分的乙醇脱氢酶基因(Alcohol dehydrogenase1, Adh1),然后通过转座的方式在整个玉米基因组中扩增这个基因(Bureauet al., 1994; Jin and Bennetzen, 1994)。同样,逆转座子的逆转录和整合功能也可以使植物中正常细胞的 mRNA 产生无内含子的假基因(Drouin and Dover, 1987)。并且这些扩增的基因序列可以作为新基因进化的原材料。
异位重组是造成染色体重排的最主要原因。由于LTR逆转座子的高拷贝数和散在分布于植物的基因组中,它们也会经常发生异位重组。同一染色体相同方向中同一家族中逆转座子间的异位重组会导致重复和缺失,而在同一染色体相反方向的元件间发生不等重组会导致两个逆转座子间序列的倒位。不同染色体元件间的异位重组会导致异位。LTR逆转座子介导的基因组重排也已经在酵母和果蝇中作为不等重组的产物被观察到。如酵母中的逆转座子可以作为基因组重排的媒介物,果蝇中报道由于异位重组产生了棒眼的表现型(Lim and Simmons, 1994; Williamson, 1983)。
对基因及其功能的影响
LTR 逆转座子在数量上的扩张和收缩伴随着宿主基因组的防御机制,由此不仅改变了基因组的整体结构,而且也造成基因表达和功能的变化。LTR 逆转座子对插入位点基因的影响主要表现为:诱发基因突变、产生新基因、基因重复、提供基因调控元件,形成新的基因调控模式和表观遗传修饰的改变等,这些影响最终可能造成表型变异。
诱发基因突变
LTR 逆转座子通过插入邻近或基因内部会产生突变。研究发现,水稻突变体表现出矮化性状主要是因为水稻中 LTR 逆转座子Osr4 的插入导致D1 基因的mRNA 外显子7丢失造成的(Chenet al., 2017a);Copia 逆转座子 Bs1 插入玉米Adh1第9个外显子致使基因失活形成抗烯丙醇花粉的突变表型(Jin and Bennetzen, 1989);烟草中Copia 逆转座子 Tnp2 插入硝酸还原酶 (Nitrate reductase, NR) 基因的外显子区改变了转录本产生了硝酸还原酶不足的突变体。很多逆转座子插入基因或者邻近基因通过减少或消除基因的转录以消极的方式影响它们的表达。然而,在其它情况下,一个基因内或邻近基因逆转座子序列的插入对基因表达有更复杂的影响,包括转录时间和空间模式的改变或者蛋白质结构的改变(Flavellet al., 1994; Huet al., 1995)。
产生新基因
转座子的插入可以为蛋白质编码基因和非编码RNA的出现提供原料,这些基因可以承担重要的,在某些情况下是基本的细胞功能(Joly-Lopez and Bureau, 2018; Navilleet al., 2016)。LTR逆转座子通过转座可以增加外显子,重新排列和复制现有的宿主基因。此外LTR逆转座子衍生的非编码序列也会被转录并影响附近基因的表达(Chuonget al., 2017)。转录后的转座子产生的小 RNA 可以通过表观遗传调控的方式调节基因的表达,例如可以参与 small RNA (包括siRNA、miRNA、piRNA) 和 lncRNA 等非编码 RNA 的生成,从而进一步参与基因表达、个体发育、表观遗传等多种生物学过程。拟南芥中 LTR 逆转座子被激活时,其转录本会被加工产生大量 siRNA854,随后参与基因调控网络的构建(McCueet al., 2012)。
带来基因重复
基因可以通过RNA 中间物在逆转录基因介导的过程中进行复制,成为功能性的逆转录拷贝或逆转录基因(Retrocopies or retrogenes),生成的基因重复大多数是在植物 LTR 逆转座子的侧翼。果蝇的研究中鉴定得到15个多态性逆转录拷贝,发现所有逆转录基因都是两侧为不连续 LTR 逆转座子的内部逆转录拷贝的嵌合体。还发现逆转录基因包含了几个或多个父母本的基因序列,揭示了 LTR 逆转座子介导的基因重复可能是外显子重组的新机制(Tanet al., 2016)。番茄基因组中LTR 逆转座子家族的Rider介导的基因重复增加了Sun基因的表达量,最终形成了拉长的果实形状。这一结果表明,逆转座子可能是基因复制的主要驱动力,导致植物的表型变化(Xiaoet al., 2008)。
提供基因调控元件,形成新的基因调控模式
由于转座子通常携带自己的调控模块,决定了与转座子相关基因的不同表达模式。当转座子本身含有增强子或抑制子等调控元件时,插入基因组后可以直接调控基因表达。如一个名为 Renovator 逆转座子的 LTR 区含有一个启动子,直接提高了稻瘟病抗性基因Pit的转录水平,使水稻重新表现出相应的抗病活性,极大提高了水稻的环境适应性(Shureet al., 1983)。此外,顺式调控元件可以为转录因子提供结合位点,当反式作用因子结合到顺式调控元件的序列上,转录调控将顺利进行,而转座子可以插入顺式调控元件的序列之中破坏转录因子的结合位点来阻止它结合到对应 DNA 序列上,造成基因的异常表达。例如,LTR 逆转座子中 Gret1 插入黑皮葡萄的VvmybA1基因上游后,抑制它的表达而产生白色果皮,并产生白皮葡萄,Gret1 在插入位点又造成 DNA 序列重排,引起VvmybA1 基因的恢复突变,形成红皮葡萄(Kobayashiet al., 2004)。除此之外,转座子上可能会存在新的顺式调控元件结合位点,其它的转录因子结合在该位点上,共同到达到基因的上游,促进基因的表达。研究表明,与含有MADS-box 转录因子SEPALLATA3 (Transcription factor SEPALLATA3, SEP3) 结合基序的 Copia 逆转座子在琴叶拟南芥 (Arabidopsis lyrata) 的生殖发育中具有潜在的功能作用(Muinoet al., 2015)。
诱发表观遗传修饰的重塑
转座子也能造成动植物中基因组的表观遗传修饰改变。通过影响邻近基因的转录,产生表观等位基因,尽管它们可以代代遗传,但由于其侧翼调控元件表观修饰的可变性,从而产生表观等位基因的亚稳定状态,并表现出不同细胞的表达差异特征。目前已知,转座子对编码基因的表观遗传学效应具体包括三方面:组蛋白甲基化修饰的扩散(Sienskiet al., 2012)、DNA 甲基化修饰的扩散(Eichtenet al., 2012)、转座元件产生的小分子 RNA 对基因的影响(Weiet al., 2014)。LTR 逆转座子在特定的细胞类型中被特定的表观遗传修饰的研究相对较多。组蛋白修饰H3K27ac、H3K4me1 和H3K4me3 通常被认为是基因激活的标签,其中H3K27ac 和H3K4me1是活性增强子的表观修饰标记,H3K4me3 是活跃启动子区表观遗传修饰,这些修饰同样也在部分转座子染色质区域富集从而能激活其表达。比如在小鼠滋养外胚胎干细胞(Trophoblast stem cell, TSCs) 中,LTR逆转座子RLTR13D5 上就显著富集H3K4me1 和H3K27ac 修饰,并且激活RLTR13D5 作为增强子进一步招募TSCs 核心转录因子CDX2、EOMES 和ELF5 的结合(Chuonget al., 2013)。类似地,在人胚胎干细胞中,LTR逆转座子LTR77 等富集 H3K4me1 修饰(Xieet al., 2013);在小鼠胚胎干细胞中,LTR逆转座子RLTR9、RLTR13 等富集H3K27ac 和H3K4me1 修饰被激活并调控基因表达(Sundaramet al., 2017)。