参考
地址:https://www.ncbi.nlm.nih.gov/research/cog-project/
COG 数据库是 NCBI 开发的用于同源蛋白注释的数据库,根据蛋白质序列的相似性,将蛋白质序列分成不同的类。每个类赋予一个 COG 编号,代表着一种同源蛋白。同时,将所有的同源蛋白再分成 25 个大类。
COG 数据库包含 COG 和 KOG 两个数据库。前者对原核生物的同源蛋白进行聚类,适合原核生物的 COG 注释;后者对真核生物的同源蛋白进行聚类,适合真核生物的 COG 注释。