使用circle-map软件鉴定所有样品中的eccDNA,然后使用featurecount软件计算跨Breakpoint的reads数,作为该eccDNA的原始表达值,包括图3中红色所示reads(split reads)和蓝色所示reads(discordant read pair)。使用DESeq2 R包对原始count数进行标准化,并使用bedtools软件进行eccDNA蛋白质编码基因和非编码基因注释。
图3. eccDNA支持证据
| EccDNAid | A1(raw) | … | B3(raw) | A1 (norm) | … | B3 (norm) | gene_name |
|---|---|---|---|---|---|---|---|
| chr1:1245571-1246304 | 1 | … | 12 | 1.5 | … | 3.24 | TSPAN6 |
| GeneID | description | Pathway | GO-BP | GO-CC | GO-MF |
|---|---|---|---|---|---|
| 7105 | tetraspanin 6 | … | GO:0043123 | GO:0016021 | GO:0005515 |
表4. eccDNA表达谱
各列说明:
eccDNAid:eccDNA的id,由染色体,起始坐标,终止坐标组成
A1-B3(raw):跨break point的原始reads数
A1-B3(norm):跨break point的标准化reads数
gene_name:eccDNA相关基因的名字
strand:eccDNA相关基因的转录方向
biotype:基因类型,protein_coding:蛋白质编码基因;lncRNA:长链非编码RNA
GeneID:eccDNA相关基因的entrez gene id
Synonyms:eccDNA相关基因的别名
dbXrefs:eccDNA相关基因在其他数据库中的名字
chromosome,map_location:eccDNA相关基因的染色体及位置
description:eccDNA相关基因的描述
GO-BP:基因相关GO biological process term ID及名字
GO-CC:基因相关GO cellular component term ID及名字
GO-MF:基因相关GO molecular function term ID及名字
