基因本体论(Gene Ontology,GO)计划(http://www.geneontology.org)为注释基因、基因产物和序列开发了一套结构化的、受控词汇表。它被分成3个部分:分子功能(Molecular Function,MF)、生物过程(Biological Process,BP)和细胞组分(Cell Component,CC)。我们使用clusterProfiler R包对差异表达eccDNA来源基因进行GO功能富集分析,以注释并推测这些eccDNA的功能。
| ID | Description | GeneRatio | BgRatio | pvalue | p.adjust | qvalue | geneID | Count |
|---|---|---|---|---|---|---|---|---|
| GO:0042110 | T cell activation | 26/272 | 483/18866 | 8.97E-09 | 2.7E-05 | 2.56-05 | CD6 | 26 |
表7. 差异表达eccDNA来源基因GO分析结果
各列说明:
ID:GO term ID
Description:GO term的描述
GeneRatio:输入基因和特定GO term中所包含的基因共有的基因个数 / 总的输入基因个数
BgRatio:特定GO term中所包含的基因个数 / 背景基因个数(即数据库中的全部基因)
pvalue:特定GO term的富集p值
p.adjust:调整的p值(默认BH算法)
qvalue:特定GO term的富集q值
GeneID:输入基因和特定GO term中所包含的基因共有的基因名字
Count:输入基因和特定GO term中所包含的基因共有的基因个数
我们提供了以p<=0.05为显著条件的富集结果(sig.xlsx),top10条目的条形图(barplot)、气泡图(dotplot)和三合一图等图。
并且提供了不设置阈值过滤的总结果(all.xlsx),以供参考。
图8. top 10显著富集的GO条目bar图
图9. top 10显著富集的GO条目dot图
图10. 三合一图
