DNA 甲基化是细胞分裂过程中遗传的一种表观遗传标记,影响细胞的生物学功能。而单细胞水平上的全基因组甲基化分析将有助于深入了解转录调控和细胞异质性。
单细胞 DNA 甲基化研究怎么做?
来自韩国的科研人员在《Biomolecules》发表综述文章,介绍了单细胞 DNA 甲基化分析方法,包括实验策略和数据分析;此外,还介绍了相关科研应用并讨论了未来的发展。
Introduction to Single-Cell DNA Methylation Profiling Methods,2020 IF:4 分多
注:此篇综述没有介绍 5mC 分析方法,虽然介绍了许多多组学方法,但每种方法的单独分析过程未作深入讨论。
实验方法
单细胞 DNA 甲基化分析方法简述
注:本文没有介绍EM-seq和TAPs-seq,因为这两种技术还达到在单细胞应用的程度。
亚硫酸氢盐转化法
亚硫酸氢盐转化法被认为是 DNA 甲基化分析的金标准。 由于它的高转化率(>99%)、可重复性和通过商业试剂盒的简单易用性而受到研究人员的青睐。然而,亚硫酸氢盐转化法采用了导致 DNA 降解的苛刻反应条件,PBAT 的开发即是为了解决降解造成的损失问题。
在单细胞 DNA 甲基化分析方法中最大限度地减少 DNA 损失的关键策略
RRBS 和 WGBS 是流行的全基因组甲基化分析方法。 这两种方法都包括亚硫酸氢盐转化和 NGS 制备。主要区别在于,RRBS 使用适当的限制性内切酶和大小选择来筛选富含 GC 的区域。WGBS(特别是 MethylC-seq)的优势在于能够覆盖基因组中的大部分 CpGs。与 RRBS 相比,WGBS 的纯化和筛选过程相对简单。在 WGBS 中防止亚硫酸氢盐转化过程中的降解损失被认为是相对重要的,因此许多基于 WGBS 的单细胞方法往往是基于 PBAT 的。
多组学方法是根据甲基化分析方法与其他分析方法(RNA、染色质可及性)相结合来区分的。 例如 scM&T-seq 是基因组和转录组测序(G&T-seq)与 scBS-seq 的结合,G&T-seq 是一种基于 Smart-seq2 识别 DNA 和 RNA 的方法。此外,应用于单细胞甲基化分析方法的技术,如 PBAT,也可以类似地应用于 NOME-seq,NOMe-seq 可以根据核糖体的存在与否,利用 GpC 甲基转移酶的染色质可及性差异,确认双硫酸盐转化的 DNA 中开放染色质和 CpG 甲基化。scCOOL-seq、iscCOOL-seq 和 scNome-seq 可以一起监测染色质可及性和 CpG 甲基化。
无转换的方法
通过转化以外的方法观察甲基化主要分为两类:利用甲基胞嘧啶的亲和结合和利用限制性内切酶对甲基胞嘧啶的敏感性。MBD-seq 和 MeDIP-seq 是具有代表性的基于亲和性的方法。基于亲和力的方法不适合在单细胞规模上应用,因为这些方法基于 DNA 片段产生平均 DNA 甲基化谱,这不允许区分单个细胞中 DNA 甲基化模式的差异。然而,与基于亲和力的方法不同,基于 MSRE 的方法可以被改进,使用 MSRE 的单细胞方法的细化可以在 Methyl-seq 中看到,scCGI-seq 测量甲基化的方式与 Methyl-seq 类似。
数据分析
DNA 甲基化数据分析方法
在测序实验之后,包括 RRBS 或 WGBS,需要对数据进行预处理。预处理步骤可分为数据质控(QC)、序列修剪和比对,例如使用FastQC测量总体的基本测序数据质量,使用Trim Galore!、fastp 和 Trimmomatic等软件修剪,下表列出了常用的比对工具。
亚硫酸氢盐测序序列比对软件
甲基化分析的主要目的是探索构成样本、器官和疾病状态(包括癌症)之间差异的表观遗传学证据。为了发现这些差异,需要一个暗示此概念的数值,一个广泛使用的术语是β值。在甲基化调用后,进行后续分析,如可视化分析的 t-SNE,聚类分析,以及识别差异甲基化胞嘧啶(DMCs)或差异甲基化区域(DMRs)
上述方法主要依赖于单个 CpG 位点的甲基化水平。最近的甲基化分析利用了每条 测序获得的reads 的甲基化模式来诊断疾病,尤其是癌症。这种新的分析概念是基于甲基化的生物学特性,即除非出现从头甲基化,否则相邻 CpG 位点之间有保持甲基化的趋势。该读取模式方法能够检测具有疾病信号的 DNA 分子,并且具有增加疾病信号检测机会的可能性。 例如,一项大型液体活组织检测研究设计了一个集成分类器,根据读取模式分析对肿瘤类型进行分类,并在早期癌症的检测中显示出显著的结果。此外,通过甲基化模式对肿瘤衍生的 DNA 分子进行量化是观察肿瘤负担的另一种方法。
甲基化模式分析在癌症临床环境中的应用
应用
细胞发育
生殖细胞或胚胎细胞的成熟受到特定基因表达的影响,这与 DNA 中的甲基化水平相关。例如基于植入前的胚胎细胞的甲基化特征,利用单细胞甲基化测序,通过对早期胚胎系追踪的研究,研究植入前细胞甲基化的机制及其现象。研究团队观察到非 CpG 甲基化在卵母细胞成熟过程中不断积累,说明非 CpG 甲基化与 CpG 甲基化在卵母细胞成熟过程中的作用不同。
与疾病相关的研究
在疾病患者中,DNA 甲基化的模式与健康人不同。在各种疾病中,癌症尤其具有正常细胞所不具有的 DNA 甲基化模式,从而导致基因表达水平的差异。在对具有这种异质性的癌症研究中,需要使用多组学方法,将基因组变异和 RNA 表达结合起来进行分析。例如一个研究小组最近开发了一种称为 scTrio-seq2 的方法,它整合了单细胞转录组和单细胞甲基化测序数据。多项研究表明使用单细胞甲基化测序(sc-methyl-seq)的多组学方法可以克服先前方法的局限性,并且具有更好的鉴别能力。因此,sc-methyl-seq 可用于各个领域,以解决与生物过程和疾病相关的基本问题。
单细胞 DNA 甲基化研究仍存在一些问题。其中第一个问题是亚硫酸氢盐转化的降解问题,这是目前的金标准。然而,在数量有限的单细胞尺度上,由于降解而造成的损失比在体积尺度上更严重。为了解决这个问题,采用了 PBAT 等技术,但其性能无法与使用大量 DNA 的方法相比。近年来,利用 TET 酶活性的方法,如 TAPS 和 EM-seq,已经被开发出来,并作为一种解决慢性降解问题的方法而受到关注。另一个问题是一个明确的标准分析过程还没有建立。由于这些挑战,目前最好的方法是引入多组学方法进行交叉验证。
随着数据采集的成本正在逐渐降低和数据联盟的建立(例如国际人类表观基因组联盟(IHEC)等),全面数据的积累可以提供一个了解甲基化的机会。关于甲基化证据的积累将使大家有可能找到因不同组织类型、不同实验或环境条件以及异质性疾病(如癌症)而波动的甲基化热点区域。此外,通过积累的数据发现细胞类型的特异性标记,将有利于通过单细胞 DNA 甲基化数据的可视化来进行细胞异质性分析,包括在 t-SNE 图中分配细胞集群。相信对甲基化及其在疾病中的生物学作用之间关系的理解将随着未来进一步的数据而得到揭示。
国家基因库大数据平台
国家基因库生命大数据平台 (CNGBdb) 是一个为科研社区提供生物大数据共享和应用服务的统一平台,基于大数据和云计算技术,提供数据归档、知识搜索、计算分析、管理授权等数据服务。
参考文献
Ahn J, Heo S, Lee J, et al. Introduction to Single-Cell DNA Methylation Profiling Methods[J]. Biomolecules, 2021, 11(7): 1013.
图片均来源于参考文献,如有侵权请联系删除。
https://mp.weixin.qq.com/s/vff3_OaUEU6RxPlY_vCO5g