表观遗传(Epigenetics)是指 DNA 序列未发生变化,但基因表达却发生了可遗传改变。表观遗传学则是指基于非基因序列改变所致基因表达水平变化,如 DNA 甲基化和染色质构象变 化等;表观基因组学 (epigenomics) 则是在基因组水平上对表观遗传学改变的研究。

    表观遗传改变主要从四个层面调控基因表达:

    (1)DNA 甲基化:DNA 共价结合甲基基团,使相同序列等位基因处于不同修饰状态;
    (2)组蛋白修饰:通过对结合 DNA 的组蛋白进行不同的化学修饰实现对基因表达的调控;
    (3)染色质重塑:通过改变染色质的空间构象实现对基因表达的调控;
    (4)非编码 RNA 的调控:RNA 可通过某些机制实现对基因转录和转录后的调控。

    今天所要介绍的就是甲基化 DNA 甲基化数据库。甲基化 (methylation) 是蛋白质和核酸的一种重要的修饰,能够调节基因的表达和关闭,与癌症、衰老、老年痴呆等许多疾病密切相关,是表观遗传学的重要研究内容之一。而 DNA 甲基化是 DNA 化学修饰的一种形式,是 DNA 序列上特定的碱基在 DNA 甲基转移酶(DNMT)的催化作用下,以 S - 腺苷甲硫氨酸(SAM)作为甲基供体,通过共价结合的方式获得一个甲基基团的化学修饰过程。接下来看看甲基化数据库有哪些吧!

    01

    RMBase

    http://rna.sysu.edu.cn/rmbase/

    史上最全甲基化表观调控数据库汇总解读 - 知乎 - 图1

    RMBase 简单来说是一个 RNA 水平表观遗传修饰查询的数据库,用于整合转录组测序数据,以探索 RNA 的转录后修饰,可以查询疾病相关 SNP 和 RNA 结合蛋白(RBP)的关系。该数据库由屈良鹄教授实验室构建。里面有 13 个物种的 47 个研究中的 566 个数据集和 1 397 244 个修饰位点,m 6 A、m 5 C、2’-O-Me 和 100 种其他类型的修饰物。

    科研风暴:RMBase:RNA 甲基化修饰数据库

    02

    RMVar

    http://rmvar.renlab.org/

    史上最全甲基化表观调控数据库汇总解读 - 知乎 - 图2

    RMVar 数据库主要是收集了影响 m6A 修饰的相关变异,也整合了与变异相关的 RBP 结合区、miRNA - 靶点和剪接位点,以帮助用户研究 m6A 相关变异对转录后调控的影响。库内收录的修饰物包括 m6 A,m 6 Am,m 1 A,ψ,m 5 C,2’-O-Me 和 m 7 G,5 - 甲基尿苷 m5U,A 至 I。还整合了来自全基因组关联研究 (GWAS) 和 ClinVar 的数据,所以 m6AVar 也可为研究 m6A 相关变异和疾病间的关系提供支持。

    科研风暴:RMVar:m6A 修饰相关甲基化数据库

    03

    m6A-Atlas

    http://180.208.58.66/m6A-Atlas/

    史上最全甲基化表观调控数据库汇总解读 - 知乎 - 图3

    m6A-Atlas 是专门用于解读 m6A 表观遗传组,m6A-Atlas 具有可靠的 m 6 A 位点和定量表观转录组谱的高可信度集合。提供了保护,转录后机制的位点,假定的生物学功能和单个 m 6 A 位点的疾病关联以及感染过程中宿主和病毒的转录组。

    科研风暴:m6A-Atlas:m6A 甲基化综合型数据库

    04

    SRAMP

    http://www.cuilab.cn/sramp

    史上最全甲基化表观调控数据库汇总解读 - 知乎 - 图4

    SRAMP 数据库主要是用作预测目标 RNA 序列上 m6A 修饰位点,也是用来预测哺乳动物 m6A 修饰位点的数据库。SRAMP 运行预测时仅需要 RNA 序列,而无需加载外部组学数据。在 lncRNA、circRNA 等测序数据不充足的条件下,也是一个有力的 m6A 位点分析工具。

    科研风暴:SRAMP:哺乳动物 m6A 修饰位点数据库

    05

    EWAS Data Hub

    EWAS Datahub

    史上最全甲基化表观调控数据库汇总解读 - 知乎 - 图5

    EWAS Data Hub 有 75 344 个样本的 DNA 甲基化阵列数据,并采用有效的归一化方法来消除不同数据集之间的批量影响。EWAS 数据中心能提供不同背景下的参考 DNA 甲基化图谱,涉及 81 种组织 / 细胞类型(包含 25 个脑部和 25 种血细胞类型),6 个祖先类别和 67 种疾病(包括 39 种癌症)。EWAS Data Hub 还提供了高效的查询方式,可协助检索和发现基于甲基化的生物标记物。

    科研风暴:EWAS Data Hub:DNA 甲基化芯片数据

    06

    iMETHYL

    http://imethyl.iwate-megabank.org/index.html

    史上最全甲基化表观调控数据库汇总解读 - 知乎 - 图6

    iMETHYL 是一个 DNA 甲基化、 SNP 和 RNA_seq 的多组学联合数据库。库内提供 CD4 + T 淋巴细胞,单核细胞和嗜中性粒细胞的全 DNA 甲基化(〜2400 万个常染色体 CpG 位点),全基因组(〜900 万个单核苷酸变体)和全转录组(> 14000 个基因)数据。通过提供多组学数据和 QTL 信息,整合 SNP, DNA 甲基化和 RNA 表达谱的数据,进行两两之间的关联分析,iMETHYL 将用作综合参考数据,帮助研究人员推断 DNA 甲基化,基因组变异和基因表达之间的调控机制。

    科研风暴:iMETHYL:DNA 甲基化、 SNP 和 RNA_seq 的多组学联合数据库

    07

    MethBank

    Home - MethBank

    史上最全甲基化表观调控数据库汇总解读 - 知乎 - 图7

    MethBank 是一个非常全面的甲基化数据库,集成了各种物种的共有参考甲基化组(CRM),全基因组单碱基分辨率甲基化组(SRM),DNA 和 RNA 甲基化工具(MeTools)以及表观基因组范围关联研究(EWAS),并提供了甲基化数据可视化的交互式浏览器。数据库以高质量甲基化酶大规模整合为特色,涉及 34 个来自大量人类样品的共识参考甲基化组织,336 个来自不同发育阶段 / 5 个植物组织的单碱基分辨率甲基化组织,18 个单碱基在人类和小鼠的多个阶段从配子和早期胚胎中分辨甲基化组织。

    科研风暴:MethBank:单细胞甲基化数据库

    08

    Pubmeth

    http://www.pubmeth.org/

    史上最全甲基化表观调控数据库汇总解读 - 知乎 - 图8

    Pubmeth 是一个整理癌症相关甲基化数据库,收集和整理了文献中与癌症相关的甲基化数据,并进行了人工校对和注释,提供了一个高质量的癌症相关的发生了甲基化基因的数据库。PubMeth 包含 5000 多个记录,这些记录来自 1000 多个文献来源。

    科研风暴:Pubmeth:癌症相关甲基化数据库

    09

    SurvivalMeth

    http://bio-bigdata.hrbmu.edu.cn/survivalmeth/

    史上最全甲基化表观调控数据库汇总解读 - 知乎 - 图9

    SurvivalMeth 主要是提供癌症相关甲基化预后的信息。它收集了 36 种癌症的 DNA 甲基化谱,整合单个 DMFE、多个 DMFE、SEs 和临床数据,对预上传数据进行生存分析,还允许上传来自各种疾病的 DMFE 的定制 DNA 甲基化图谱进行分析。SurvivalMeth 为预后 DMFEs 提供了全面的资源和自动化分析,包括 DMFE 甲基化水平、相关分析、临床分析、差异分析。

    科研风暴:SurvivalMeth:甲基化预后分析专用数据库科普篇

    10

    MethSurv

    https://biit.cs.ut.ee/methsurv/

    史上最全甲基化表观调控数据库汇总解读 - 知乎 - 图10

    MethSurv 是一个基于 CpG 甲基化模式进行生存分析的网络工具,有 25 种不同人类癌症的 7358 个甲基化数据,使用了 Cox 比例风险模型开发了用于生存分析的交互式网络工具。MethSurv 能够对位于查询基因附近或附近的 CpG 进行生存分析,还可以提供对查询基因的聚类分析,以将甲基化模式与临床特征相关联,并筛选出每种癌症类型的主要生物标志物。对于不会编程的科研人员来说,MethSurv 工具是一个十分有用平台,可以对基于甲基化的癌症生物标记物进行初步筛选评估,在几秒钟内生成分析结果,对甲基化研究带来很多便利。

    科研风暴:MethSurv:TCGA 甲基化分析工具

    11

    MethyCancer

    http://methycancer.psych.ac.cn/

    史上最全甲基化表观调控数据库汇总解读 - 知乎 - 图11

    MethyCancer 主要是用于研究 DNA 甲基化、基因表达与癌症之间的相互作用,以及人类基因中 CGI 的分布,启动子 CGI 中 DNA 甲基化模式的改变。鉴定仅通过 DNA 甲基化或与遗传事件结合而改变的新癌症基因,以及发现新的表观遗传的目标。它包含来自公共资源的高度集成的 DNA 甲基化数据,癌症相关基因,突变和癌症信息,以及来自我们大规模测序的 CpG Island(CGI)克隆。可以在基因组和遗传数据的背景下查看 DNA 甲基化。

    科研风暴:MethyCancer:癌症相关甲基化基因数据库

    12

    DiseaseMeth

    The human disease methylation database

    史上最全甲基化表观调控数据库汇总解读 - 知乎 - 图12

    DiseaseMeth 是一个专注于人类疾病的异常甲基化数据库,不仅包括多种癌症,同时还包括神经发育和退行性疾病、自身免疫疾病等数据集。通过人工搜索了近些年文献报道的新异常甲基化基因,32701 甲基化谱样本数,88 种疾病,679602 对甲基化相关的疾病基因关系。数据库还提供了三个新的在线工具用于聚类分析,功能注释或者生存分析。

    科研风暴:DiseaseMeth:人类疾病甲基化数据库
    https://zhuanlan.zhihu.com/p/340075830