参考

COG 数据库是 NCBI 开发的用于同源蛋白注释的数据库，根据蛋白质序列的相似性，将蛋白质序列分成不同的类。每个类赋予一个 COG 编号，代表着一种同源蛋白。同时，将所有的同源蛋白再分成 25 个大类。

COG 数据库包含 COG 和 KOG 两个数据库。前者对原核生物的同源蛋白进行聚类，适合原核生物的 COG 注释；后者对真核生物的同源蛋白进行聚类，适合真核生物的 COG 注释。

组学分析