基因本体论(Gene Ontology,GO)计划(http://www.geneontology.org)为注释基因、基因产物和序列开发了一套结构化的、受控词汇表。它被分成3个部分:分子功能(Molecular Function,MF)、生物过程(Biological Process,BP)和细胞组分(Cell Component,CC)。我们使用clusterProfiler R包对差异表达eccDNA来源基因进行GO功能富集分析,以注释并推测这些eccDNA的功能。

    ID Description GeneRatio BgRatio pvalue p.adjust qvalue geneID Count
    GO:0042110 T cell activation 26/272 483/18866 8.97E-09 2.7E-05 2.56-05 CD6 26

    表7. 差异表达eccDNA来源基因GO分析结果
    各列说明:
    ID:GO term ID
    Description:GO term的描述
    GeneRatio:输入基因和特定GO term中所包含的基因共有的基因个数 / 总的输入基因个数
    BgRatio:特定GO term中所包含的基因个数 / 背景基因个数(即数据库中的全部基因)
    pvalue:特定GO term的富集p值
    p.adjust:调整的p值(默认BH算法)
    qvalue:特定GO term的富集q值
    GeneID:输入基因和特定GO term中所包含的基因共有的基因名字
    Count:输入基因和特定GO term中所包含的基因共有的基因个数

    我们提供了以p<=0.05为显著条件的富集结果(sig.xlsx),top10条目的条形图(barplot)、气泡图(dotplot)和三合一图等图。
    并且提供了不设置阈值过滤的总结果(
    all.xlsx),以供参考。
    3.8 差异表达eccDNA来源基因的GO富集分析 - 图1
    图8. top 10显著富集的GO条目bar图
    3.8 差异表达eccDNA来源基因的GO富集分析 - 图2
    图9. top 10显著富集的GO条目dot图
    3.8 差异表达eccDNA来源基因的GO富集分析 - 图3
    图10. 三合一图