​Nat Commun|李蔚/史偈君联合开发计算衡量DNA甲基化/去甲基化拮抗作用的方法 - 图1

    责编 | 酶美

    DNA 胞嘧啶甲基化是一种可逆的表观遗传修饰,参与调控基因表达和染色质开放程度,广泛影响个体发育、癌症发生和衰老等生物学过程。哺乳动物甲基化组 (methylome) 由两个相互拮抗的生物学作用共同形成,即 DNA 甲基转移酶 DNMT 介导的甲基化 (methylation) 和 TET 双加氧酶介导的去甲基化 (demethylation)。这两个酶家族在 DNA 上的结合呈现竞争模式【1】 ,敲降Dnmt3a后 TET1 蛋白在基因启动子区域(promoter)的结合增强,反之亦然【2】 。前人研究表明,Dnmt3a & Tet2 双敲除小鼠的存活率低于Dnmt3aTet2单敲除小鼠【3】 。并且,在人类 T 细胞淋巴瘤中, DNMT3ATET2 的突变呈现显著的并存【4】 。这些发现表明甲基化和去甲基化过程的并发与肿瘤发生密切相关。然而,目前没有方法能够衡量两者的并发,其与基因表达的关联也未被揭示。

    近日,来自美国加州大学尔湾分校李蔚教授团队的史偈君等研究人员在Nature Communications杂志发表文章The concurrence of DNA methylation and demethylation is associated with transcription regulation,开发了基于亚硫酸氢盐测序 (bisulfite-seq) 的计算生物学方法——甲基化并发率 (methylation concurrence ratio),能够衡量甲基化和去甲基化过程在基因调控元件上的拮抗作用,具有不同于传统平均甲基化 (average methylation ratio) 的生物学特性,并可作为抑癌基因的新型表观遗传分子标记。

    ​Nat Commun|李蔚/史偈君联合开发计算衡量DNA甲基化/去甲基化拮抗作用的方法 - 图2

    自甲基化测序方法面世以来,DNA 甲基化水平一直以 “平均” 的方式进行量化,但这种方法无法刻画甲基化的局部变异。
    如图 1a 所示,虽然两个例子的甲基化模式存在明显差异,但平均甲基化却都是 0.5。Example 2 中存在较多的不完全甲基化片段,在这些片段上可能同时存在甲基化与去甲基化作用。因此,研究人员将不完全甲基化片段中的未甲基化 CpG 定义为“甲基化并发 CpG”(图 1b 中红色所示),甲基化并发率即为并发 CpG 的比率。
    如图 1b 所示,与平均甲基化相比,甲基化并发率对甲基化模式的局部变异更加敏感。
    如图 1c和d 所示,研究人员分析了 DNMT 和 TET 酶的 ChIP-seq 数据,并定义了基因启动子区的 “DNMT-TET 共结合指数”。该指标越大,表明 DNMT 和 TET 酶在启动子区的共结合效应越强;反之,若该指标为 0,则表明两者不存在共结合。该共结合指数与甲基化并发率之间存在显著的正相关性(Spearman’s R = 0.47,图 1d),而与平均甲基化的相关性并不显著(图 1c)。
    这表明甲基化并发率可以刻画 DNMT 和 TET 酶的共结合,而平均甲基化则不能

    ​Nat Commun|李蔚/史偈君联合开发计算衡量DNA甲基化/去甲基化拮抗作用的方法 - 图3
    图 1. 平均甲基化与甲基化并发率方法的比较

    虽然平均甲基化方法已被广泛使用,但其与基因表达的关系仍不完全明确。目前普遍认为启动子区 CpG 岛(CpG island)的平均甲基化与基因表达水平呈负相关,但是基因体区域(gene-body)和增强子区域(enhancer)的平均甲基化与基因表达的关系仍存在争议。本研究发现,不同类型调控元件的平均甲基化与基因表达水平的相关性不尽相同。而甲基化并发率能够更好的指示基因表达水平,不论哪一种基因调控元件(例如启动子、基因体和增强子)上的甲基化并发率始终与基因表达呈现较强的负相关性。之后,研究人员发现抑癌基因在正常样本中的甲基化并发率水平很低,并且该现象在不同组织中高度保守。通过分析 TCGA 中多种癌症(子宫肌瘤、乳腺癌等)样本的甲基化组,进而发现肿瘤中甲基化并发率的升高与 40~60% 的抑癌基因表达下调有关,而这些基因的平均甲基化却未发生改变。总之,本研究提出了甲基化并发率这一新型甲基化量度方法,强调了甲基化局部变化对基因表达的显著影响,拓展了我们对肿瘤异常甲基化模式的理解。

    文章的第一作者为史偈君博士,通讯作者为李蔚教授。
    文章原文链接:https://www.nature.com/articles/s41467-021-25521-7
    公众号原文链接:https://mp.weixin.qq.com/s/-GwzQQabEHGxkMXQatiRcQ

    Code availability:https://github.com/JiejunShi/CAMDA,Concurrence of Active Methylation and De-methylAtion (CAMDA)
    image.png
    图 1. 亚硫酸氢盐测序捕获的甲基化并发示意图。
    亚硫酸氢盐测序reads分为三类片段,即甲基化(M)片段(图1中连续的实心圆圈)、未甲基化(U)片段(连续的空白圆圈)和甲基化-并发(C)片段(连续的红色圆圈) .
    image.png
    图 2. 甲基化并发率的定义。
    基因组区域的甲基化并发率定义为C片段权重的总和除以该区域中所有片段的权重总和。每个片段的权重可以设置为其 CpG 的数量(在下面的第1节中)或 1(未加权,在下面的第2节中)。’ M ‘、’ U ‘和’ C ‘分别代表甲基化片段、未甲基化片段和甲基化同时片段的数目。’ω m ‘、’ω u ‘ 和’ω c ‘ 是每个片段的权重。

    参考文献

    1. Charlton, J. et al. TETs compete with DNMT3 activity in pluripotent cells at thousands of methylated somatic enhancers. Nat Genet 1–9 (2020) doi:10.1038/s41588-020-0639-9.
    2. Gu, T. et al. DNMT3A and TET1 cooperate to regulate promoter epigenetic landscapes in mouse embryonic stem cells. Genome Biol 19, 88 (2018).
    3. Zhang, X. et al. DNMT3A and TET2 compete and cooperate to repress lineage-specific transcription factors in hematopoietic stem cells. Nat Genet 48, 1014 1023 (2016).
    4. Couronné, L., Bastard, C. & Bernard, O. A. TET2 and DNMT3A mutations in human T-cell lymphoma. _New Engl J Medicine_366, 95–6 (2012).

    [

    ](https://mp.weixin.qq.com/s/-GwzQQabEHGxkMXQatiRcQ)
    思考:这种以片段/区域的甲基化水平当成基因组甲基化水平的基本单位,之前也有人报道和研究过,类似研究的出发点也是这篇文章的核心:“平均” 的方式进行量化基因组甲基化水平,这种方法无法刻画甲基化的局部变异。所以可以尝试这种方法,但是后续的分析步骤也可能随之改变。
    综述-单细胞DNA甲基化研究基础篇:从实验策略到数据分析方法简介