KEGG官网首页:

https://www.kegg.jp/kegg/

通过KO文件认识KEGG数据库 - 图1

下载KEGG Orthology (基因组全域的基因直系同源组别)文件

人类KEGG Orthology (KO)下载地址:https://www.genome.jp/kegg-bin/get_htext?ko00001

通过KO文件认识KEGG数据库 - 图2

得到一个3Mb左右的.keg文件。

查看

8个大类

  1. grep ^A ko00001.keg

通过KO文件认识KEGG数据库 - 图3

54个小类

  1. grep ^B ko00001.keg

通过KO文件认识KEGG数据库 - 图4

可以发现,以B开头有空行出现。

  1. grep "B 09" ko00001.keg|wc -l
  2. 54

通过KO文件认识KEGG数据库 - 图5

523条通路(PATH)

  1. grep ^C ko00001.keg|wc -l
  2. 523
  3. grep ^C ko00001.keg|grep "ko"|wc -l
  4. 498
  5. grep ^C ko00001.keg|grep "PATH"|wc -l
  6. 445
  7. grep ^C ko00001.keg|grep "BR"|wc -l
  8. 53

通过KO文件认识KEGG数据库 - 图6

“BR”似乎代表了该通路下无蛋白/基因富集:

通过KO文件认识KEGG数据库 - 图7

同时还存在无标识的一些“通路”:

通过KO文件认识KEGG数据库 - 图8

52573个通路中的蛋白质/酶

  1. grep ^D ko00001.keg|wc -l
  2. 52573

其中有402个未确定蛋白。

  1. grep "uncharacterized" ko00001.keg|wc -l
  2. 402

通过KO文件认识KEGG数据库 - 图9

org.Hs.eg.db包内数据

通过KO文件认识KEGG数据库 - 图10

没有显示数字,从日期上来看更新是及时的。

*ftp://ftp.genome.jp/pub/kegg/genomes 试了很多种方法都打不开。